本發(fā)明涉及DNA的體外重組技術(shù)領(lǐng)域,具體涉及一種大分子DNA的無縫分步組裝連接的方法。
背景技術(shù):
通過DNA體外重組技術(shù)合成大分子DNA片段在基因功能研究上的需求越來越多。大片段合成的一個(gè)最基本的要求就是將多個(gè)小的DNA片段按照一定的方向和精確的堿基順序組裝在一起形成較大的DNA分子。傳統(tǒng)的方法依賴于限制性內(nèi)切酶的酶切和DNA連接酶的連接。在載體構(gòu)建中,這種方法一般適用于小于3kb的DNA片段的插入,一旦插入的DNA分子過大,常常會導(dǎo)致沒有合適的酶切位點(diǎn)用來連接插入片段和載體,如果用稀有酶切位點(diǎn)來分段酶切和連接,又會引入不需要的酶切位點(diǎn)堿基,破壞了原來DNA序列的結(jié)構(gòu)。位點(diǎn)特異性重組是一種不依賴于酶切位點(diǎn)的活體內(nèi)重組方法,該方法依賴于小范圍同源序列的聯(lián)會,重組也只發(fā)生在兩個(gè)特異的同源短序列的范圍之內(nèi),但該方法如果應(yīng)用于大分子DNA序列的分段組裝同樣也會在原來序列中引入重組所必須的特異位點(diǎn)堿基,這些特異位點(diǎn)堿基也破壞了原來DNA序列的結(jié)構(gòu)。為了不破壞DNA序列的原有結(jié)構(gòu),研究人員又開發(fā)了一種不依賴連接(ligation-independent cloning,LIC)的克隆方法。LIC方法中,線性化的骨架質(zhì)??梢酝ㄟ^酶切或PCR獲得,插入片段一般通過PCR獲得,在設(shè)計(jì)插入片段的引物時(shí),使線性化的質(zhì)粒片段與插入片段之間具有15-35bp的同源末端,同源末端在核酸外切酶的作用下特異切割DNA的5’端序列產(chǎn)生互補(bǔ)配對的單鏈末端,通過退火使互補(bǔ)配對的單鏈末端兩兩結(jié)合在一起,再在DNA聚合酶作用下在形成有單堿基缺口的不穩(wěn)定的環(huán)狀DNA分子,將環(huán)狀DNA分子轉(zhuǎn)化到大腸桿菌后,可以在大腸桿菌體內(nèi)修復(fù)缺口形成完整的環(huán)狀質(zhì)粒。該方法在兩種酶的作用下,可以將多個(gè)片段一次組裝到質(zhì)粒中而不破壞原來DNA序列的結(jié)構(gòu),因此LIC方法又被稱為一步克隆無縫酶促組裝。由于酶促組裝方法能一次無縫組裝兩個(gè)以上的片段,具有靈活,省時(shí)和省工的優(yōu)勢,使得該方法有逐步替代傳統(tǒng)的酶切-連接方法的趨勢,市場上也已經(jīng)出現(xiàn)了多種商業(yè)化試劑盒,比如國外的Gibson Cloning Kit、 HD Cloning Kit和國內(nèi)北京全式金的pEASY-Uni Seamless Cloning and Assembly Kit等。然而,在實(shí)際應(yīng)用中一步克隆酶促組裝法的成功率極易受組裝片段數(shù)目的影響,Nick S.Berrow等報(bào)道一個(gè)質(zhì)粒骨架片段和一個(gè)插入片段即兩個(gè)片段的一步克隆酶促組裝的成功率大于60%,一個(gè)質(zhì)粒骨架片段和兩個(gè)插入片段即三個(gè)片段的一步組裝的成功率低于40%,而三個(gè)以上片段的一步酶促組裝的成功率小于10%,即使在三個(gè)以上片段的一步組裝反應(yīng)中能獲得幾個(gè)組裝 成功的質(zhì)粒,但往往由于被組裝的DNA序列片段過長導(dǎo)致PCR過程中容易引入堿基錯配,使得實(shí)驗(yàn)功虧一簣。因此,三個(gè)以上片段的一步酶促組裝很難得到序列完全正確的組裝質(zhì)粒。由于兩個(gè)片段酶促組裝的成功率遠(yuǎn)大于三個(gè)及以上片段的一步酶促組裝成功率,因此也可以將大分子DNA片段隨機(jī)分成多個(gè)小片段,采用“兩片段酶促組裝+多個(gè)酶促反應(yīng)步驟”的模式將長鏈DNA片段克隆到質(zhì)粒上,這種模式不僅極大地提高了酶促組裝的成功率,而且可以在第一個(gè)小片段組裝成功后立即測序,獲得序列完全正確的組裝產(chǎn)物后再進(jìn)行下一個(gè)片段的組裝,更容易獲得序列完全正確的最終酶促組裝產(chǎn)物。但這種模式的酶促組裝需要在上一次組裝成功后恢復(fù)一個(gè)酶切位點(diǎn)用于產(chǎn)生下一次酶促組裝的裝配入口,同時(shí)被恢復(fù)的酶切位點(diǎn)的堿基序列又不能破壞原有的DNA序列結(jié)構(gòu)。目前還沒有相關(guān)的方法報(bào)導(dǎo)能通過“分段+分步酶促組裝”模式實(shí)現(xiàn)大分子DNA的無縫組裝的目標(biāo)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明要解決的技術(shù)問題是克服現(xiàn)有技術(shù)的不足,提供一種能通過“分段+分步酶促組裝”模式實(shí)現(xiàn)大分子DNA的無縫組裝的目標(biāo)的方法。
為解決上述技術(shù)問題,本發(fā)明提出的技術(shù)方案為一種基于酶切位點(diǎn)拼接策略的DNA分步無縫酶促組裝方法,這個(gè)方法可以像堆積木一樣將DNA小片段一個(gè)一個(gè)逐步無縫組裝到骨架質(zhì)粒中,形成最終所需要的質(zhì)粒載體。包括以下步驟:
(1)分析被組裝序列的酶切位點(diǎn),獲得所有不出現(xiàn)在被組裝序列中的酶切位點(diǎn);
(2)從上述不出現(xiàn)在被組裝序列中的酶切位點(diǎn)對應(yīng)的限制性內(nèi)切酶中選擇合適的一個(gè)酶切骨架載體,使載體線性化并產(chǎn)生組裝入口。優(yōu)先選用常用的限制性內(nèi)切酶。線性化載體的兩個(gè)末端分別包含酶切位點(diǎn)的部分堿基或一半堿基,命名為拼接堿基。例如粘性末端酶BamHI酶切載體補(bǔ)平末端后的5’-3’正義鏈兩端分別殘留堿基GGATC和GATCC,GGATC和GATCC稱為BamHI的兩個(gè)拼接堿基。而平端酶SmaI酶切載體后,5’-3’正義鏈兩端分別殘留CCC和GGG,CCC和GGG稱為SmaI的兩個(gè)拼接堿基。識別位點(diǎn)同為6個(gè)堿基的BamHI(GGATCC)和SmaI(CCCGGG),粘性末端酶的拼接堿基為5個(gè)堿基,而平末端酶為3個(gè)堿基,拼接堿基的堿基數(shù)越少則它在序列中出現(xiàn)的頻率越高,有利于后續(xù)的分段和引物設(shè)計(jì),因此粘性末端酶和平端酶中優(yōu)選平端酶。
(3)同一組裝酶的兩個(gè)拼接堿基在被組裝序列中出現(xiàn)的頻率和位置都不同,優(yōu)選在被組裝序列中出現(xiàn)頻次高且大致均勻分布的拼接堿基。根據(jù)以上原則選擇合適的拼接堿基并根據(jù)拼接堿基選擇對應(yīng)的組裝方向,以BamHI為例,拼接堿基GGATC對應(yīng)的組裝方向?yàn)?′→3′,拼接堿基GATCC對應(yīng)的組裝方向?yàn)?′→5′。幾種常用的限制性內(nèi)切酶的拼接堿基及對應(yīng)的 組裝方向見表1;
表1 幾種常用的限制性內(nèi)切酶的拼接堿基及對應(yīng)的組裝方向
(4)選擇合適數(shù)目的拼接堿基將大片段DNA分成幾個(gè)小的DNA組裝片段,設(shè)計(jì)一套重疊引物來擴(kuò)增組裝片段。拼接堿基的數(shù)目不宜過多也不能太少,過多則組裝步驟多,太少則組裝片段過長增加了PCR的難度,合適的組裝片段長度為1.5-3.5kb。引物設(shè)計(jì)的原則如下:i,所有引物都包含重疊序列和片段特異序列,重疊序列是與相鄰片段同源的序列,長度為15-25bp;為了獲得特異PCR產(chǎn)物建議將片段特異序列長度設(shè)計(jì)為25-35bp,退火溫度等于或大于68℃。ii,可以編輯與線性化載體同源的重疊序列,實(shí)現(xiàn)在擴(kuò)增產(chǎn)物中移除和恢復(fù)原有酶切位點(diǎn)或引入新的酶切位點(diǎn)的目的。iii,每個(gè)組裝片段的一對引物中,一條引物消除酶切位點(diǎn),另一條通過拼接堿基與載體同源的重疊序列拼出一個(gè)酶切位點(diǎn),該酶切位點(diǎn)可以通過限制性內(nèi)切酶的切割產(chǎn)生裝配入口用于下一步的酶促組裝;
(6)用所設(shè)計(jì)重疊引物擴(kuò)增組裝片段,PCR反應(yīng)程序?yàn)椋孩?8℃預(yù)變性3min;②5循環(huán)(98℃10s,70℃3-5min);30循環(huán)(98℃10s,68℃3-5min)③最后延伸68℃5min;④4℃保存;所用PCR酶為擴(kuò)增長片段的高保真DNA聚合酶;
(7)瓊脂糖凝膠回收線性化的載體和組裝片段;
(8)通過酶促反應(yīng)將第一個(gè)組裝片段組裝到載體中。裝配產(chǎn)物將恢復(fù)一個(gè)酶切位點(diǎn)。酶促反應(yīng)體系為:全式金2×Assembly Mix 5ul,線性化載體和插入片段各2.5ul,總體積10ul。反應(yīng)條件:50℃,40min;
(9)重復(fù)(7)和(8)將所有組裝片段一個(gè)接一個(gè)地通過多步酶促反應(yīng)組裝到載體上。
分步無縫酶促組裝的關(guān)鍵原理是用出現(xiàn)在被組裝大分子DNA中的拼接堿基將被組裝的大分子DNA分成若干小的組裝片段,在設(shè)計(jì)重疊引物時(shí)一條引物都通過拼接堿基與線性化 載體的重疊區(qū)的拼接恢復(fù)原有的酶切位點(diǎn),因此所擴(kuò)增出來的每個(gè)組裝片段裝配到線性化載體后都能恢復(fù)原有的酶切位點(diǎn),該酶切位點(diǎn)可以被切割產(chǎn)生裝配入口用于下一次的酶促組裝。下一次酶促組裝完成后,前一個(gè)組裝片段和后一個(gè)組裝片段的分界點(diǎn)即為拼接堿基,由于拼接堿基本身存在于被組裝序列中,所以前一個(gè)組裝片段和后一個(gè)組裝片段之間沒有引入額外的堿基,實(shí)現(xiàn)了兩個(gè)組裝片段之間的無縫連接。
與現(xiàn)有技術(shù)相比,本發(fā)明提供的一種能通過“分段+分步酶促組裝”模式實(shí)現(xiàn)大分子DNA的無縫組裝的目標(biāo)的方法,其有益效果在于:1、利用拼接堿基可以將大片段DNA分子分成若干個(gè)小片段,降低了PCR的難度,并由于拼接堿基的存在實(shí)現(xiàn)了分步無縫組裝的目標(biāo)。2、與傳統(tǒng)的酶切連接方法相比,本發(fā)明不依賴于連接,幾乎不受到酶切位點(diǎn)的限制。3、克服了傳統(tǒng)酶切連接方法和位點(diǎn)特異性重組方法容易引入額外堿基的缺點(diǎn),實(shí)現(xiàn)了分步無縫連接的目的。4、本發(fā)明的方法比多個(gè)片段一步克隆酶促組裝具有更可控的組裝成功率和更高的序列準(zhǔn)確率。
附圖說明
圖1 不出現(xiàn)在4.98kb DNA序列中的酶切位點(diǎn)
圖2 骨架載體pLDR
圖3 選取2個(gè)拼接堿基GGATC將4.98kb的DNA序列分成三個(gè)大小差不多的DNA片段,長度分別為1995bp,1657bp和 1332bp
圖4 分步無縫組裝4.98kb DNA序列,其中pLDR表示骨架載體的序列;BF1表示第一個(gè)片段的序列;BF2表示第二個(gè)片段的序列;BF3表示第三個(gè)片段的序列,方框中的序列為BamHI的拼接堿基。A為第一輪酶促組裝反應(yīng),將第一個(gè)片段BF1裝配至骨架質(zhì)粒pLDR中,形成中間質(zhì)粒pLDR-BF1;B為第二輪酶促組裝反應(yīng),將第二個(gè)片段BF2裝配至質(zhì)粒pLDR-BF1中,形成中間質(zhì)粒pLDR-BF1~BF2;C為第三輪酶促組裝反應(yīng),將第三個(gè)片段BF3裝配至質(zhì)粒pLDR-BF1~BF2中,形成最終質(zhì)粒pLDR-BF1~BF3
圖5 PCR篩選陽性單克隆,M為TAKARA 1kb DNA ladder。A:從24個(gè)單克隆中PCR篩選到21個(gè)陽性的pLDR-BF1質(zhì)粒;B:從24個(gè)單克隆中PCR篩選到10個(gè)陽性的pLDR-BF1~BF2質(zhì)粒;C:從24個(gè)單克隆中PCR篩選到15個(gè)陽性的pLDR-BF1~BF3質(zhì)粒
圖6 對終載體pLDR-BF1~BF3進(jìn)行酶切驗(yàn)證,其中M為TAKARAλ-HindIII digest DNA marker;1為BamHI酶切后能獲得預(yù)期的14777bp條帶;2為SalI酶切后能獲得預(yù)期的12629bp和2148bp的條帶
圖7 不出現(xiàn)在7.09kb DNA序列中的酶切位點(diǎn)
圖8 選取1個(gè)的拼接堿基GGG將7.09kb的DNA序列分成兩個(gè)大小差不多的DNA片段,長度分別為3586bp和 3507bp
圖9 分步無縫組裝7.09kb DNA序列,其中,pLDR表示骨架載體的序列;PF1表示第一個(gè)片段的序列;PF2表示第二個(gè)片段的序列;方框中的序列為SmaI的拼接堿基。A為第一輪酶促組裝反應(yīng),將第一個(gè)片段PF1裝配至骨架質(zhì)粒pLDR中,形成中間質(zhì)粒pLDR-PF1;B為第二輪酶促組裝反應(yīng),將第二個(gè)片段PF2裝配至質(zhì)粒pLDR-PF1中,形成最終質(zhì)粒pLDR-PF1~PF2
圖10 PCR篩選陽性單克隆,M為TAKARA 1kb DNA ladder。A:從12個(gè)單克隆中PCR篩選到6個(gè)陽性的pLDR-PF1質(zhì)粒;B:從12個(gè)單克隆中PCR篩選到7個(gè)陽性的pLDR-PF1~PF2質(zhì)粒
圖11 對終載體pLDR-BP1~PF3進(jìn)行酶切驗(yàn)證,其中M為TAKARAλ-HindIII digest DNA marker;1~5為KpnI酶切pLDR-BP1~PF3的第1號、3號、7號、8號和10號質(zhì)粒,酶切后能獲得預(yù)期的12615bp和4271bp的條帶。
具體實(shí)施方式
實(shí)施例1
以產(chǎn)生粘性末端的限制性內(nèi)切酶切割質(zhì)粒產(chǎn)生組裝入口的方式,從5′→3′方向組裝日本晴的Chr.3:3700958-3705941的DNA序列(seq1),序列長度為4.98kb。步驟如下:
1、用DNAssit 2.0的軟件分析4.98kb的DNA序列的酶切位點(diǎn),共有44個(gè)酶切位點(diǎn)不出現(xiàn)在該DNA序列中,其中包括4個(gè)常見的酶切位點(diǎn),分別為BamHI,PstI,SpeI和XbaI(圖1)。
2、選擇BamHI酶切骨架載體pLDR(圖2),那么被組裝序列的拼接堿基可以選擇GGATC也可以選擇GATCC,但由于GGATC比較均勻地分布在4.98kb的DNA序列中,故選擇GGATC作為拼接堿基,對應(yīng)的組裝方向?yàn)?′→3′方向。
3、在4.98kb的DNA序列中共有6個(gè)GGATC的拼接堿基,挑選其中2個(gè)將4.98kb的DNA序列分成三個(gè)大小差不多的DNA片段BF1、BF2和BF3。三個(gè)DNA片段的長度分別為1995bp,1657bp和1332bp(圖3)。GGATCC
4、設(shè)計(jì)擴(kuò)增三個(gè)DNA片段的重疊引物(表2),其中在第一個(gè)片段BF1的正向引物B1-F的重疊序列中刪除一個(gè)堿基C從而消除BamHI位點(diǎn),反向引物B1-R則通過第一個(gè)拼接堿基GGATC與重疊序列中的堿基C拼出一個(gè)BamHI酶切位點(diǎn),當(dāng)BF1與線性化載體pLDR與組裝后,第一輪組裝產(chǎn)物pLDR-BF1將恢復(fù)一個(gè)BamHI位點(diǎn)用于產(chǎn)生第二輪酶促反應(yīng)的組裝入口。第二個(gè)片段BF2的正向引物B2-F位于第一個(gè)拼接堿基附近,包含BF2的特異序列和BF1末端15bp的同源序列,反向引物B2-R與第一個(gè)片段的反向引物B1-R設(shè)計(jì)類似。第三個(gè)片段的引物B3-F和B3-R設(shè)計(jì)原則類似于第二個(gè)片段。
表2 組裝4.98kb的DNA序列的重疊引物
5、用步驟3中設(shè)計(jì)的第一個(gè)片段的引物B1-F和B1-R從日本晴基因組DNA中通過PCR擴(kuò)增出第一個(gè)片段BF1,PCR反應(yīng)程序?yàn)椋孩?8℃預(yù)變性3min;②5循環(huán)(98℃10s,70℃2min);30循環(huán)(98℃10s,68℃2min)③最后延伸68℃5min;④4℃保存;所用PCR酶為KOD FX DNA聚合酶。并用瓊脂糖凝膠電泳回收BF1和步驟2中酶切獲得的線性化載體pLDR。
6、將回收的BF1和線性化載體pLDR各2.5ul與5ul全式金2×Assembly Mix混合,于50℃條件下酶促反應(yīng)40min,將第一個(gè)片段BF1組裝到質(zhì)粒pLDR(圖4A)。酶促反應(yīng)后將酶促產(chǎn)物通過熱擊方式轉(zhuǎn)化到大腸桿菌感受態(tài)細(xì)胞,轉(zhuǎn)化產(chǎn)物涂布于含有卡那霉素抗性的LB平板上過夜培養(yǎng)。第二天挑取單菌落用引物B1-F和B1-R進(jìn)行菌落PCR檢測,24個(gè)單克隆中PCR檢測呈陽性的單克隆有21個(gè),說明BF1組裝成功的質(zhì)粒pLDR-BF1有21個(gè)(圖5A)。將pLDR-BF1-1、pLDR-BF1-2和pLDR-BF1-3三個(gè)PCR檢測呈陽性的單克 隆送測序公司測序,其中質(zhì)粒pLDR-BF1-2中的第一個(gè)片段BF1序列測序完成正確,其他兩個(gè)質(zhì)粒的BF1序列都有堿基突變,可能為PCR過程中由堿基錯配引入的突變。留選質(zhì)粒pLDR-BF1-2用于第二輪的酶促組裝。
7、正確組裝第一個(gè)片段BF1后,重復(fù)步驟5和6將第二個(gè)片段BF2組裝到質(zhì)粒pLDR-BF1-2(圖4B),經(jīng)PCR檢測獲得10個(gè)陽性質(zhì)粒pLDR-BF1~BF2(圖5B),經(jīng)測序其中pLDR-BF1~BF2-7的序列完全正確,留選用于第三輪的酶促組裝。
8、正確組裝第二個(gè)片段后,重復(fù)步驟5和6將第三個(gè)片段BF3組裝到質(zhì)粒pLDR-BF1~BF2-7(圖4C),經(jīng)PCR檢測獲得15個(gè)陽性質(zhì)粒pLDR-BF1~BF3(圖5C),經(jīng)測序其中pLDR-BF1~BF3-1的序列完全正確。對終載體pLDR-BF1~BF3進(jìn)行酶切驗(yàn)證,其中BamHI酶切后能獲得預(yù)期的14777bp條帶,SalI酶切后能獲得預(yù)期的12629bp和2148bp的條帶(圖6),說明4.98kb的DNA序列被正確組裝到質(zhì)粒載體pLDR中。
實(shí)施例2
以產(chǎn)生平端的限制性內(nèi)切酶切割質(zhì)粒產(chǎn)生組裝入口的方式,從3’→5’方向組裝日本晴的Chr.9:16782917-16790009的DNA序列(seq2),序列長度為7.09kb。步驟如下:
1、用DNAssit 2.0的軟件分析4.98kb的DNA序列的酶切位點(diǎn),共有26個(gè)酶切位點(diǎn)不出現(xiàn)在該DNA序列中,其中包括8個(gè)平端酶切位點(diǎn),分別為FspAI、PmeI、SmaI、SnaBI、SrfI、SspI、SwaI和XmnI(圖7)。
2、選擇常用的SmaI酶切骨架載體pLDR,那么被組裝序列的拼接堿基可以選擇CCC也可以選擇GGG,由于組裝方向?yàn)?’→5’方向,故選擇GGG作為拼接堿基。
3、在7.09kb的DNA序列中共有多個(gè)GGG的拼接堿基,在序列的中部挑選其中1個(gè)拼接堿基將7.09kb序列分成兩個(gè)大小差不多的DNA片段PF1和PF2,兩個(gè)DNA片段的長度分別為3586bp和3507bp(圖8)。設(shè)計(jì)擴(kuò)增兩個(gè)DNA片段的重疊引物,其中在第一個(gè)片段PF1的正向引物P1-F中通過第一個(gè)拼接堿基GGG與重疊序列中的堿基CCC拼出一個(gè)SmaI酶切位點(diǎn),當(dāng)PF1與線性化載體pLDR與組裝后,第一輪組裝產(chǎn)物pLDR-PF1將恢復(fù)一個(gè)SmaI位點(diǎn)用于產(chǎn)生第二輪酶促反應(yīng)的組裝入口;反向引物P1-R的重疊區(qū)因?yàn)闊o拼接堿基故不能拼接出SmaI位點(diǎn)。第二個(gè)片段PF2的正向引物P2-F與P1-F設(shè)計(jì)類似;反向引物P2-R位于第一個(gè)拼接堿基附近,包含PF2的特異序列和PF1末端15bp的同源序列(表3)。
表3 組裝7.09kb的DNA序列的重疊引物
4、用步驟3中設(shè)計(jì)的擴(kuò)增第一個(gè)片段的引物P1-F和P1-R從日本晴基因組DNA中通過PCR擴(kuò)增出第一個(gè)片段PF1,PCR反應(yīng)程序?yàn)椋孩?8℃預(yù)變性3min;②5循環(huán)(98℃10s,70℃3.5min);30循環(huán)(98℃10s,68℃3.5min)③最后延伸68℃5min;④4℃保存;所用PCR酶為KOD FX DNA聚合酶。并用瓊脂糖凝膠電泳回收PF1和步驟2中酶切獲得的線性化載體pLDR。
5、將回收的PF1和線性化載體pLDR各2.5ul與5ul全式金2×Assembly Mix混合,于50℃條件下酶促反應(yīng)40min,將第一個(gè)片段PF1組裝到質(zhì)粒pLDR(圖9A)。酶促反應(yīng)后將酶促產(chǎn)物通過熱擊方式轉(zhuǎn)化到大腸桿菌感受態(tài)細(xì)胞,轉(zhuǎn)化產(chǎn)物涂布于含有卡那霉素抗性的LB平板上過夜培養(yǎng)。第二天挑取單菌落用引物P1-F和P1-R進(jìn)行菌落PCR檢測,12個(gè)單克隆中PCR檢測呈陽性的單克隆有6個(gè),說明PF1組裝成功的質(zhì)粒pLDR-PF1有6個(gè)(圖10A)。將pLDR-PF1-4、pLDR-PF1-5、pLDR-PF1-6、pLDR-PF1-8和pLDR-PF1-9五個(gè)PCR檢測呈陽性的單克隆送測序公司測序,其中質(zhì)粒pLDR-PF1-5和pLDR-PF1-8兩個(gè)質(zhì)粒中的第一個(gè)片段PF1序列測序完成正確。留選質(zhì)粒pLDR-PF1-5用于第二輪的酶促組裝。
6、正確組裝第一個(gè)片段后,重復(fù)步驟4和5將第二個(gè)片段PF2組裝到質(zhì)粒pLDR-PF1(圖9B),經(jīng)PCR檢測和測序獲得最終的載體pLDR-PF1~PF2(圖3)。經(jīng)PCR檢測獲得7個(gè)陽性質(zhì)粒pLDR-PF1~PF2(圖10B),經(jīng)測序其中第1號、3號、7號、8號和10號的序列完全正確。用KpnI對上述五個(gè)測序正確的質(zhì)粒進(jìn)行酶切驗(yàn)證,酶切后能獲得預(yù)期的12615bp和4271bp的條帶(圖11),說明7.09kb的DNA序列被正確組裝到質(zhì)粒載體pLDR中。
SEQUENCE LISTING
<110> 湖南雜交水稻研究中心;湖南農(nóng)業(yè)大學(xué)
<120> 一種大分子DNA的體外無縫組裝方法
<130> 20161207-2
<160> 2
<170> PatentIn version 3.5
<210> 1
<211> 4984
<212> DNA
<213> 水稻種(Oryza)
<400> 1
ggacaagatc ttgaaagtgc tcgacgtcaa ttgcttgacc gaggacgcag cgccatccgc 60
caatctgctc ggcagcaatg gcgtcgtcaa ctgcggcgtc gggctgtgga tcttgccggc 120
gttcatcaac cactcgtgcc accccaacgc ccggcgcacc cacgtcggcg accacgccat 180
tgtccacgcg tcaagggaca tcaaagccgg ggaggagatc acattcgcct acttcgacgt 240
gctcaccccg gcgagcaagc gcagggaggc agcgagagcg tggggcctcg aatgccaatg 300
cgatcggtgc aggttcgaag ccagcgacgc cattgttggg caagaactca caaaacttga 360
gaacgaattg gtcaatggcc gaggaggaga catgggagca ctggtggtga ggctggagga 420
gaggatgaga aagtccatgg tgaaggagag gaggaaggcg ttcttgcgcg cgtcgttctg 480
gagcgcgtac tccgcgctgt tcgactccga caagctggtg aggaagtggg ggaggcgcgt 540
ccccggtgag gccgccgtcg cagagagcgt cgccggcgca atcggcggga acgagagcgt 600
gctgagggca atgctgaggg gtgccgacaa tggcaacggc tgcggcaatc ggctcgaggt 660
ggaagacaag gtggtgagga ttgggagggc tacctatggc agggtagtga agaggcaggc 720
aatgagagct ctcttcagac ttacattgga tgctgacagt aacaaaagcc tgtaggtttt 780
gatactcttg attgattgtt tatttagtta cctagtatct tcagtaacag atgagagatt 840
tattcagcaa atgctccggt ttgctcgaag gttgtaataa gagtgtgggc aagaatcaag 900
gtcaatccat aagagcacta ttttcatgct cttctgatct tggtttcaga cttgtttcag 960
tgttgacatt ggttatttct caattcattc gagtatttgt tgttacatca caaaggataa 1020
gttctataga aaaaatcttc cttttcaagt gatgttcttt aattttctgt agaattgtgc 1080
cctgcaattt ctcaaatctt tgatagatgg cttatttgta ttgactggaa aagaaattag 1140
ttgtcaataa ctagaagctt tagagatgca aagtattgga tatatcttgg caatagtatt 1200
ttatattgct tgtttatgtg agaatgtttt aactagatgg caactgattt ctgggacaaa 1260
atcgcttcta caatagcatt ttatggaact cgtactcgtc gatagcattt cttggatttg 1320
ggtgtttgta aatggcattt cttggatttt ctcttcatta aaatagccta ttcagatgaa 1380
gtagaattca ggtgaagtag aaaccaacta ctttgggttc acaatttata tttcttttga 1440
ggatacccca tttcatttta gttgtcatca aagactagac aatatcgaca gaaaatggta 1500
agcctggttt cagttggtga caatttaaca gaattcagat ggatatggtt ctgatattag 1560
aaggtggcat acctttagtc gctgcaaacg cttcagttat ctgaacaaaa caacgaactt 1620
ggctgagcag gggaaaaaaa tactgtagca ttcattttgt gtttacatga gtaacgattc 1680
ttttctaggt ggacagatca caaaaagaaa actaaagcta agatccaact cctaagggtg 1740
ttaggttagg gacaccatat gaatgagaca atcttaattc ttggtcacac aaagattgtc 1800
tcaaggttgg tagcatcagt gcccaatata tcacctaact atgccatcca aaatgctaca 1860
tagcatctct tgtagactga acccttcatg aagagcccca tggaggaagc tcatgcaatg 1920
ccagtgacat cattcttccc agtagcagga atccacaagc tcatagctat cttccttgtt 1980
gtcctctcat ggatcttggt ccacaagtgg agcctgagga accagaaagg gccaagatca 2040
tggccaatca tcggcgcgac agtggagcaa ctgaagaact accacaggat gcatgactgg 2100
cttgtcgagt acttgtcgaa ggacaggacg gtgaccgtcg acatgccttt cacctcctac 2160
acctacattg ccgacccggt gaacgtcgag catgtcctga agaccaactt caccaattac 2220
cccaaggtaa aagaaccata ggatcttcag tgtactgtaa aatgtgcctt gcacagtact 2280
aacactgaca caaaaaatgt ctgaaaatat gcagggtgaa gtgtacaggt cttacatgga 2340
tgtgctgctc ggtgatggca tattcaatgc cgacggcgag atgtggagga agcaaaggaa 2400
gacggcgagc ttcgagtttg cctccaagaa cttgagagac ttcagcactg tggtgttcag 2460
ggagtactcc ctgaagctat caagcattct gagccaagca tgcaaggccg gcagagttgt 2520
agacatgcag gtaaccaact gaattccttg cctaatacct aaacatttct tgagaaacca 2580
aattgttcag aattctgatg caagaactaa ccaaaattca ggaattgttc atgaggatga 2640
cactggactc gatctgcaag gtcgggtttg gggttgagat cgggacgctg tcacctgatc 2700
tcccggagaa cagctttgcc caggcattcg acgctgccaa catcatcgtc acgctgcggt 2760
tcatcgatcc tctgtggcgt ctgaagaagt tcttgcacgt cggatcagag gctctcctcg 2820
agcagagcat gaagctggtt gatgacttca cctacagcgt gatccgccgc cgcaaggctg 2880
agatcttgca ggctcgagcc agcggcaagc aagagaaggt gatccttcct ctcttgctca 2940
aagaatcagt agaactgaac tgacatggta atggtgatga tcagatcgga aaaggttttg 3000
tttcttgata tcgttgattt gtaatggcga gcagatcaag cacgacatac tgtcgcggtt 3060
catcgagctc ggggaggccg gcggcgacga ggggggcggc agcttcgggg acgacaagag 3120
cctccgcgac gtggtgctca acttcgtgat cgccgggcgt gacacgacgg cgacgacgct 3180
gtcgtggttc acgtacatgg cgatgacgca cccggccgtc gccgacaagc tccggcgcga 3240
gctggccgcg ttcgaggatg agcgcgcgcg cgaggagggc gtcgcgctcg ccgacgccgc 3300
cggcgaggcg tcgttcgcgg cgcgcgtggc gcagttcgcg tcgctgctga gctacgacgc 3360
ggtggggaag ctggtgtacc tgcacgcgtg cgtgacggag acgctccgcc tctacccggc 3420
ggtgccgcag gaccccaagg ggatcgtgga ggacgacgtg ctccccgacg gcaccaaggt 3480
gcgcgccggc gggatggtga cgtacgtgcc ctactccatg gggaggatgg agtacaactg 3540
gggccccgac gcggcgagct tccggccgga gcggtggctc agcggcgacg gcggcgcgtt 3600
ccggaacgcg tcgccgttca agttcaccgc gttccaggcc gggccgcgga tctgcctcgg 3660
caaggactcc gcctacctcc agatgaagat ggcgctcgcc atcctcttcc gcttctacac 3720
cttcgacctc gtcgaggacc accccgtcaa gtaccggatg atgaccatcc tctccatggc 3780
tcacggcctc aaggtccgcg tctccacctc cgtctgaccc ccgccgccgc tcgccggcag 3840
ccgcgccgcc gccgcccgta tcgcttaccg gagtagtaaa taagcctatg taatctggtt 3900
tgaatttgaa atttgaatgt accatgtttg attctaggat ttgttggtcc tagaccctgc 3960
ttgaaacggt gcgaatttca tctaaatggt tgagaaattt tatcgaaagc tgttccattc 4020
tacgctacaa atggtgggac tggatttaaa cattggcgac gtggacaagg ccgtatcacc 4080
atgtttgcac atttttaaac ctgtaatctg gtttgaattt gaatgtacca tgacaccatg 4140
tttgcaaaac tttacatgaa tgtttgagaa aaaatatgga gaactgttca attagtatgc 4200
gtttaaaatg ggactggatt taaacattgg cgacgtggac aaggctagtg gactgagact 4260
ctgagatgtt gcggaagtcg gggacgcagc ggcggcagcc gccggcgtgg cggcggtgcc 4320
ggagcctgcg acacatcaag cagatgcacg cggtgatggc gctccggggc ttcctctccg 4380
atccctccga gctccgcgag ctccttttcg cctccgccgt cgcggtccgc ggcgccatcg 4440
cgcacgccta cctcgtgttc gaccaaatac cccgcccgga ccgcttcatg tacaacaccc 4500
tcatccgcgg cgccgcccac acggccgcgc cccgggacgc tgtctccctg tacacgcgca 4560
tgctgcggcg cggcggcggc ggcggcgtga ggcccgacaa gctcacgttc ccgttcgtgc 4620
tccgcgcttg caccgccatg ggcgcggggg acaccggggt tcaggtgcac gcccacgttg 4680
tgaaggctgg ctgcgagtcc gacgcgttcg tcaagaacgc gctcattggc atgcacgcga 4740
gctgcgggaa tttgggcatt gcggctgctc tgttcgatgg cagagctcgt gaggatgccg 4800
tggcttggtc ggcgatgatc acggggtgtg caaggcgagg ggacattggt gctgcacggg 4860
acctgttcga cgaatgtcct gtgaaggacc tcgtgtcctg gaatgtgatg atcaccgcgt 4920
atgcgaagcg gggagatatg gcattggcaa gggagctatt cgaccaggta cccgagcgag 4980
atgt 4984
<210> 2
<211> 7093
<212> DNA
<213> 水稻(Oryza)
<400> 2
gtcatgcatt cagccgtcag aaaggctcag atttatttcc gtggaataaa cagaaatctc 60
caaaagacaa ctctagcctt ggagttaaca agtggatggt gcttactgat tctgcttgga 120
agattggagc aaaaggacta gaaagtgcat tcttgaaggt tctttgtgat cctctttatt 180
attattttcc tttgtatccc tccagttttt ctttttcttt tgactaattc agtttttttt 240
ccttgaaggg tggtagtgca ttgactctga aaatgatcta tgaatcggta ggtatactgt 300
tttatgaagt tagattgatt ttactttttc ttacagcatc attagacatt aatggactta 360
tcatcatggt agttagccaa gagactatct ggaaagctgc tcatggaggc tggtaaatat 420
gagataaaga aagaacttct aaagcaggta tatgtatttt agttgatatc tgtaagcaat 480
ttttcctgat tttattattt gctcatctca taattctttt aacagaataa tagatatact 540
catgttctgg ccccacctga aaaatgcagt agcatagctt gatacacaga tcatatacac 600
aagctgtaac tattttttta attgttataa taaatatcct ttgggagtac tgaggtttgc 660
catctgcagg gtggacgatt agctgctgtt aatctggagt ctcgagctgg tttgcttgca 720
gctaggcagg taacattctc atctgtcagc agctacttcc atgcataatt ggtatattat 780
gctcccagta ttatctgaaa aactgcacat tttagatggt cgtttgaata atcctcttga 840
atgtatgcat gcagggtttg gcacgtgcag catctagata tgttggtctt aggagtgtca 900
tgacgtttct tggaccaatg tatgtttctg ctaatatatc tggaatctgt ttgttgctgt 960
atttttttaa atcaataata cactatcagg tttccgcatg tttctataaa aaatttgacc 1020
tcttttcctt tttggtcaat agtaggttct tatggttaat ttatttttgg gtgcatgatg 1080
tattcatgtt ttgctacttc aacttgctgt tctgagttta ctgtttgtca gatctacttt 1140
ttaagtaatg attcattcac aataagcttc ttcaaatgct ttgttgtgtt gaattttgag 1200
cagactataa atcagttact gactcttctg ttctacaact tcttgctgca tagaatgtgg 1260
gggacactct tggctgacat tgtgatccaa atgcttggga cagactatgc tagaattgtg 1320
caggcaatct atgcttttgc tcaggtgagc ttctgattgt tcagtttttc gtccagtaac 1380
tcactgtcca tccattgagt tcacatctta gcctttctaa cagattcggc tgactaggac 1440
atcttacata gaatctcatg aagaataatc aacagtggga catttctggt ctggactaac 1500
agggcattct gggcccatag tgtacattct gatcatgcag aacatttttg gttgagtgct 1560
ggcgcaattc tcccaagagg actcgaggac agtaagttca tactttcaca gaagttgtgc 1620
agctgatgta aatgcataga agttagatga cagaacaatt gatagatgct aggtaggata 1680
gatggtacag atgacacaca aatcatctat gcttttgaat tctccaaggt ttaaggctgc 1740
tgcttaagtg agagcttgtt atacattcca ggaaaaatta atttactgcc actatagaat 1800
ggtgtaattg tatttaagaa atagctcaca atgaccatta gggccaccta ctctctaaac 1860
gcggtagttg tgaatgaata tacatccact tcacacttcc acgagggccc gaagttgtag 1920
accatgcatt ccattctgct ccagttaatt atgcaacaaa acggttcccc tgatcttaaa 1980
ctattgcccc cctaacattc agttaggcaa ggcatacttc attgacatta gtccatgctt 2040
atcccagcca tatgttacag atatgcttac gtgtaaacac cagggcataa tttgcatgtt 2100
gcaccctgct tattcccctt atcaaaacac tagcaactaa tttatcagta caggctagat 2160
atcattattc aaaatcgcaa caagtatggt atactcacat taccaaaact tgccatactt 2220
catttagcta acatgtctaa catgtggcca acaaaattaa agccacactt tagccatagg 2280
agagtaaact tgccacactt ttatgtgcca atgacatgta ggacccacat catggtgaag 2340
gaatcttgtt aaaagtgtgg caccaaccaa acgaatgcct aactaagtca aacctggcta 2400
acttgagttg tggcatgatg aggcaaattg tggtagtgaa ccaaacaacc ccttaatatc 2460
tacttcctcc gtttcaggtt ataagacttc attgcctaca ttcatataga tgttaacgaa 2520
tctagacaca tttatataaa tgtgtctaga ttcgttaaca tctatatgaa tgtatataaa 2580
tgtgtctaga ttcgttaaac atctatatga atgtgggcaa tactagaaat tcttataacc 2640
tgaaatggat gtagtactag attgtgtaac aattcagata gctagtgcaa ttggtgattg 2700
attaatttta cagtccttat gtatttggag gtatcataat cttaagtgtt aatttgtgat 2760
acctcctggt cctcaacact agagagatac taagtggtaa cactgcaaaa tgtggcatct 2820
cctggtacct tttaagtacc aaatgcacta ggtgcctttg cgcaaaattc ccagatgaga 2880
ggacccaatt tgtgatcgtg tgcgacatgt ctagaagggt ggcccattgt ttacattcct 2940
tcaccagatc gccgaagctt tctaaatcgc gggcacttaa cgcgtgagaa gcccaatgag 3000
acctccaaat gctaacctta aaatcgcagc gctgcacggc gacatggtct cctagctagc 3060
tgcctagctt ctcggcgacg ttgattggca gcaactagct agctcgccgt ccggccggcc 3120
ggccatggcg cctaagatgg tgatcagcct ggggagctcg cggcggcgga agcgcggcga 3180
gatgctgttc cggttcgagg ccttctgcca gcccggctac ccggcgaact tcgccggcgc 3240
cggcggcttc agggacaacg tgaggacgct gctcggcttc gcgcacctgg aggccggcgt 3300
ccacggcgag accaagtgct ggtcgttcca gctcgagctg caccgccacc cccccaccgt 3360
cgtgaggctc ttcgtcgtcg aggaggaggt cgccgcctcg ccgcaccgcc agtgccacct 3420
ctgccgccat attggtccgt cgaacaaact acaattaatc aatcaacctt tacataggat 3480
tgatccgatc gatgccatgg tgttgtaggg tgggggaggc atctgatatg cagcaagagg 3540
tatcacttct tgctgccgag gagggaatcg gcggcggaag ccgacggcct gtgcttcgcg 3600
atcaaccacg gcggcggcgg tggcgcggag aaagcgtcgt cgaaagggac gacgacgacg 3660
gcctccagca gaggccacct gctacacggc gtcgtgcacc tcaacggcta cggccacctc 3720
gtcgccctcc acggcctcga gggcggctcc gacttcgtct ccggccacca gatcatggac 3780
ctctgggacc gcatttgctc agccttgcac gtaaggtagt agtagtatac atgtgcgtgt 3840
gcatgcatgc aagcaatgca acgatgtcgg gctgcgtgtg agaacatttg cttgggcatg 3900
gtgtggtgta tgcaaggacg gtgagcctgg tggacacggc gaggaagggc cacatggagc 3960
tgaggctgct gcacggcgtc gcgtacggcg agacgtggtt cgggcggtgg gggtacaggt 4020
acggccggcc gagctacggc gtcgcgctgc cgtcgtaccg gcagtcgctg cacgtgctcg 4080
gctccatgcc gctctgcgtg ctggtgccgc acctgtcgtg cttcagccag gagctcccca 4140
tggtggtcac caagtaccag gccatcagcg gccacaagct gctcagcctc ggcgacctcc 4200
tccgcttcat gctcgagctg cgcgcccgcc tgccggccac ctccgtcacg gccatggact 4260
accggggcat catgtcggag gcctcgtgcc ggtggtcggc gaagcgcgtc gacatggcgg 4320
cgcgcgccgt cgtggacgcg ctccgccgcg ccgagccggc ggcgcggtgg gtcacgcggc 4380
aggaggtgcg cgacgcggcg cgcgcctaca tcggcgacac gggcctcctc gacttcgtgc 4440
tcaagtccct cggcaaccac atcgtcggca actacgtcgt gcgccgcacc atgaacccgg 4500
tgaccaaggt gctcgagtac tgcctcgagg acgtctccag cgtgctcccg gcggtcgccg 4560
ccggcggcgg cgtgccggcg cagggcaaga tgagggtgag gttccagctc acgcgtgcgc 4620
agctcatgag ggacctggtg cacctgtacc ggcacgtgct caaggagccc agccaggcgc 4680
tcaccggcgg cgcgttcggc gcgatcccgg tggcggtgcg gatggtcctg gacatcaagc 4740
acttcgtcaa agattaccac gaaggacaag ccgcggcgag cagcaatggc ggtggcggat 4800
tcgggcatcc ccacatcaac ctgtgctgca cgctgctcgt gagcaacggg agcccggagc 4860
tagctccacc gtacgagacg gtgaccctgc cggcgcacgc gacggtgggc gagctgaagt 4920
gggaggcgca gagggtgttc agcgagatgt acctcggcct gaggagcttc gcggcggact 4980
ccgtcgtcgg ggtcggcgcc gaccaggagg gcctcccggt gctcgggctg gtcgacgtcg 5040
gaagcgccgt cgtggtgcaa gggagcgtgg gcgagcagat aaacggggag gaccacgaga 5100
ggaaggagga ggcggcggcg gcggccgtgt gcgaggggag cggcggcggc gagcgcgtcg 5160
tggactgcgc gtgcggcgcg gtggacgacg acggcgagcg catggcgtgc tgcgacatct 5220
gcgaggcgtg gcagcacacg cggtgcgccg ggatcgcgga caccgaggac gcgccgcacg 5280
tcttcctctg cagccggtgc gacaacgacg tcgtgtcgtt cccgtccttc aactgttaga 5340
tgtgatgctg ctgctgctac tgctactact actgcctctg ctgctatata tgatgctacc 5400
tagtacaagt gatcgagaat tcaatttgtt ttctcggcaa aaccaaaatg aaaacgaagg 5460
taaaaccaag tgaacttcag atcaattcag acttctcaac tttcctccca agagaaaaaa 5520
aagaatatga aaaaccatcg agcccactta atgtgggccg gtgtttgttt attccagccc 5580
aggaggatcc atggttagaa tcacccaatc aggccaggag cccaggacaa catcttctaa 5640
caaatgggtc tcctagaggt gaattacggc tataccatga tgggctgggc cgtgaccatg 5700
taacctacct gaaatgaggt gcccatgaat tttattgctt ccaagttcaa ctcatcttca 5760
taagatagtt ttcttcaact gtgtgattat tatgtcagtg gcttagagca ggagaggctt 5820
gatgaccagc ttaagggttg cacctaatgt ctaatgacta agttaagtac ctatcaggta 5880
acagtgctac taaactggca agtgaccacc aaaagatgag ctattcacat ggcctgcttg 5940
gaggggccca cttggtggtg tcatgaaagg ccttttagga aaggggcttc cctacactgt 6000
ggacactgct gctgctacta ctatcctatt cctactccac gtttgcatgc atccatggga 6060
gaagggagaa gctagccatg gtttctggtt ggaagcatcc aactaacatc ctgaatgatt 6120
catgtctagc tttgatggca agaaacatgc tttagcccac caacgcaaaa gctaaactga 6180
acctgcaaca atgtgctccc catcgtgctt gcacgcttaa ttacctttca gatgcttgag 6240
atttgagatc ctcactttct ttccttactg ttagaacagt gaacagatca ttctccattt 6300
tatctcttcc aaaagccaag tggctgctga gtagtgatta gcaagaaggt agaaatttca 6360
gtagaaaaag ggactagtac atagtgacat actgcacact ttgaccattg caacagcaaa 6420
gaagtgggaa ttgttctgaa gaagaacaaa gcaagaagaa acaaatgact tatcattgaa 6480
gcaatgaaaa gagagggagg aaagttgttt tgcttttatc tctctcactg tcactctctc 6540
tgccagtaga gggactccat ttgtcctgtg tccctagtga gacaacctag ctagcctttt 6600
cttttcccct ctctctttct gttcttttgc agttttgcat tgcaaggact gaaggccccc 6660
tttgttaggg ctctttcact caccctgatg agatgcctgt ttctctctcc atctttttcc 6720
cgtctctttt tgtttcatta atctgtctct gacatgttga ggtgatccac cactatggtg 6780
tgagggcgat aggggcacat ggtctggtgg ctcggctaaa aagggactca tcaactaaaa 6840
ggaagggagc aagtagctta agctagcaac agagtgaaga taggaagatc gatgtggaag 6900
tgactagaga acggcatctt ggaagcaagc cagcaagagg agctactaac tgcttttgct 6960
ccgttttctg actaataatg tgctcatttg ccactctcat tttgcctagt tcaggacact 7020
ctctgaagct cttactaact aattcaaaag caacattaat tttaattact ggccacctcc 7080
acagtccaca tgc 7093