專利名稱:多核苷酸裝配的組合物和方法
多核苷酸裝配的組合物和方法本申請要求根據(jù)35U. S. C. § 119(e)的于2008年11月19日提交的美國臨時申請?zhí)?1/116109和于2009年3月23日提交的美國臨時專利申請?zhí)?1/162230的利益,其內(nèi)容在此整體引用作為參考。
1.發(fā)明領(lǐng)域本申請一般地涉及重組DNA技術(shù)領(lǐng)域,尤其是大量的DNA片段有序裝配為裝配好的多核苷酸的改進(jìn)的方法。2.
背景技術(shù):
多核苷酸的重組可以用本領(lǐng)域公知的多種方法來完成。重組核酸的傳統(tǒng)技術(shù)使用限制性內(nèi)切酶和連接酶以創(chuàng)造新的核酸分子。重組分子例如克隆和表達(dá)載體可以用于將感興趣的核酸序列整合進(jìn)入宿主細(xì)胞的基因組,和/或驅(qū)動一個或多個感興趣的基因的表達(dá)。在所述細(xì)胞中用載體來驅(qū)動感興趣的基因的表達(dá),例如在酵母細(xì)胞中,需要載體包含使感興趣的基因能夠復(fù)制和表達(dá)的必要的遺傳元件。這些元件可以包括,例如,感興趣的基因,啟動子序列,終止子序列,選擇性標(biāo)記,整合位點,等等。用傳統(tǒng)的基于限制性內(nèi)切酶和連接酶的方法將元件裝配進(jìn)單一的載體是耗時而又費力的。每個亞克隆步驟,即將新的核酸片段引入已存在的多核苷酸,需要在引入新加片段之前對所得到的克隆進(jìn)行篩選和表征。通過平末端連接而產(chǎn)生的克隆需要確認(rèn)所述片段以正確的方向引入。另一方面,粘性末端連接需要受體片段上用于產(chǎn)生粘性末端的限制性酶切位點也存在于供體片段上,但又不能在供體片段中打斷感興趣的序列的位點。因此,選擇可使用的限制性酶切位點完全依賴于要加入的組合物片段,并且每個案例都必須小心考慮。另外,這些方法經(jīng)常將外源核酸序列引入到所獲得的克隆中,所述序列能夠干擾需要的基因產(chǎn)物的結(jié)構(gòu)和功能。進(jìn)一步限制基限制性內(nèi)切酶的克隆方法效率的因素是能夠在一個反應(yīng)中連接在一起的核酸分子數(shù)量的固有限制。聚合酶鏈?zhǔn)椒磻?yīng)(PCR)是一種強大的技術(shù),通過其可以體外擴增特定的多核苷酸,包括基因組DNA、cDNA和mRNA。PCR典型的包括在一定條件下使目標(biāo)核酸的分離的互補鏈接觸兩個寡核苷酸引物,所述條件允許在兩條鏈上的互補引物延伸產(chǎn)物的形成。這些鏈作為需要的核酸序列合成拷貝的模板。通過在自動系統(tǒng)中重復(fù)分離和合成步驟,可以實現(xiàn)目標(biāo)序列的指數(shù)復(fù)制。PCR的一種方法,稱為“重疊區(qū)擴增拼接法”(“ SOE ”,參見例如美國專利號 5023171),使得不用限制性內(nèi)切酶或連接酶而在精確接點裝配DNA分子變得方便。用于重組的組分片段使用獨特設(shè)計的引物在分離的聚合酶鏈?zhǔn)椒磻?yīng)中產(chǎn)生,所述引物產(chǎn)生具有彼此互補末端的擴增子。在這些擴增子的混合和變性中,在3’末端具有互補序列的鏈彼此重疊并作為引物。這些重疊區(qū)通過DNA聚合酶延伸而產(chǎn)生核酸分子,在該分子中原始序列被 “拼接”在一起。PCR的后繼循環(huán)擴增了所獲得的拼接多核苷酸。盡管在結(jié)合大量核酸片段方面相對傳統(tǒng)的基于連接酶的方法更加高效,SOE卻需要時間來優(yōu)化引物序列和擴增條件以產(chǎn)生需要的產(chǎn)物。要拼接在一起的片段之間的每個接點必須分別考慮,并且必須為每個片段涉及一對引物,以使得這些末端兼容。設(shè)計PCR引物的傳統(tǒng)考慮,例如解鏈溫度、G-C含量、避免發(fā)卡和二聚化形成和錯誤引導(dǎo)位點的嚴(yán)格性,必須被更加仔細(xì)的考慮,因為在SOE反應(yīng)中將被拼接的片段的數(shù)量增加了。因此,盡管重組DNA技術(shù)發(fā)展了,仍然存在提供快速而有序地裝配多核苷酸的改進(jìn)方法的需求。尤其需要的方法是能簡化大量多核苷酸的裝配,其具有最少的對中間產(chǎn)物的操作和和表征,而不需要引物優(yōu)化步驟。這些和其它需求都可以通過本發(fā)明的組合物和方法來滿足。3.發(fā)明概述本發(fā)明提供的組合物和方法允許快速而有序地裝配或“縫合”組分多核苷酸,成為裝配好的多核苷酸。在一些實施方式里,本發(fā)明的方法提供使用環(huán)形核酸裝配載體。在某些實施方式里,裝配載體包含組分多核苷酸,其中所述組分多核苷酸包括一個DNA片段,其側(cè)翼是(i)3’端的可退火接頭;(ii) 5’端的引物結(jié)合片段和3’端的可退火接頭;(iii) 3’ 端和5’端的可退火接頭;(iv) 5’端的可退火接頭和3’端的引物結(jié)合片段;或(ν) 5’端的可退火接頭。在一些實施方式里,多個組分多核苷酸可以通過在單一反應(yīng)器里提供多個裝配載體來縫合在一起。在某些實施方式里,反應(yīng)器里的組分多核苷酸可以從裝配載體分離。在某些實施方式里,所述組分多核苷酸然后可以被變性,可退火接頭序列可以被退火為鄰近的組分多核苷酸的互補鏈,而所述組分多核苷酸可以通過重復(fù)區(qū)延伸拼接法(SOE)縫合進(jìn)入裝配好的多核苷酸,然后進(jìn)行PCR。在其它實施方式里,從裝配載體分離的組分多核苷酸可以在用所述組分多核苷酸轉(zhuǎn)化的宿主細(xì)胞體內(nèi)通過同源重組而裝配進(jìn)入裝配好的多核苷酸。裝配好的多核苷酸可以進(jìn)一步在宿主細(xì)胞體內(nèi)結(jié)合并介導(dǎo)同源重組。多核苷酸裝配的效率可以通過提供與裝配載體一起使用的可退火接頭序列的標(biāo)準(zhǔn)試劑盒來促進(jìn),例如,如SEQ ID NO :1-23所描述的??赏嘶鸾宇^序列在裝配反應(yīng)中提供相鄰組分多核苷酸之間的重疊序列。理想地,可退火接頭序列在RNA和DNA水平均缺乏明顯的二級結(jié)構(gòu),不以不希望的方式與另一個發(fā)生交叉反應(yīng),并具有相對較高的解鏈溫度(Tm)。 從而,多個組分多核苷酸可以被縫合在一起而不需要為每個組分多核苷酸設(shè)計獨特的引物,因此節(jié)約了時間和勞動力。本發(fā)明提供的組合物和方法可以用于裝配多種類型的多核苷酸,包括合成性基因,結(jié)構(gòu)體,克隆載體,表達(dá)載體,染色體,基因組,肽文庫等等。在一個方面,本發(fā)明提供了載體,即裝配載體,可用于從多個組分多核苷酸裝配一個或多個裝配好的多核苷酸。在一些實施方式里,裝配載體是環(huán)形多核苷酸并以5’至3’方向包含限制性酶切位點RA,可退火接頭序列LA,DNA片段D,可退火接頭序列LB,以及限制性酶切位點 RB(即5,-RA-LA-D-LB-RB-3,)。在一些實施方式里,裝配載體是環(huán)形多核苷酸并以5, 至3’方向包含限制性酶切位點RA,DNA片段D,可退火接頭序列LB,和限制性酶切位點 RB(即5’ -RA-D-LB-RB-3')。在一些實施方式里,裝配載體是環(huán)形多核苷酸并以5’至3’ 方向包含限制性酶切位點RA,可退火接頭序列LA,DNA片段D,和限制性酶切位點RB(即 5’ -RA-LA-D-RB-3’ )。在一些實施方式里,裝配載體是環(huán)形多核苷酸并以5’至3’方向包含限制性酶切位點RA,引物結(jié)合片段PA,DNA片段D,可退火接頭序列LB,和限制性酶切位點RB(即5’ -RA-PA-D-LB-RB-3')。在一些實施方式里,裝配載體是環(huán)形多核苷酸并以5’至3’方向包含限制性酶切位點RA,可退火接頭序列LA,DNA片段D,引物結(jié)合片段PBJP 限制性酶切位點RB(即5,-RA-LA-D-PB-RB-3').在一些實施方式里,裝配載體是環(huán)形多核苷酸并以5’至3’方向包含限制性酶切位點RA,可退火接頭序列LA,DNA片段D,可退火接頭序列LB,和限制性酶切位點RB(即5,-RA-LA-D-LB-RB-3')。示例性的裝配載體在圖IB 和圖2中提供。在一些實施方式里,引物結(jié)合片段(即,PA或PB)可以是不與用于產(chǎn)生裝配好的多核苷酸的可退火接頭序列互補的任何核苷酸序列。在一些實施方式里,引物結(jié)合片段包括限制性內(nèi)切酶識別位點和/或切斷位點。在一些實施方式里,引物結(jié)合片段包含允許的接頭序列之一的核酸序列(例如,SEQID NO :1-23之一),或其互補物,不用于特定的裝配反應(yīng)。在一些實施方式里,引物結(jié)合片段PA的核酸序列選自SEQ ID NO :24,25和其互補物。 在一些實施方式里,引物結(jié)合片段PB的核酸序列選自SEQ ID NO :24,25和其互補物。在優(yōu)選實施方式里,引物結(jié)合片段PA和引物結(jié)合片段PB在序列上不完全相同。在一些實施方式里,兩個或多個可退火接頭序列為至少M個核苷酸長度并具有至少60°C的Tm。在一些實施方式里,兩個或多個可退火接頭序列具有至少70%的G-C含量和至少 70°C的Tm,并且不形成明顯的二級DNA結(jié)構(gòu)。在一些實施方式里,可退火接頭序列LA的核酸序列選自SEQ ID N0:l-8及其互補物。在一些實施方式里,可退火接頭序列LB的核酸序列選自SEQ ID NO :1-8及其互補物。在一些實施方式里,可退火接頭序列LA和可退火接頭序列LB的核酸序列選自SEQ ID NO :1_8及其互補物。在一些實施方式里,兩個或多個可退火接頭序列具有至少30%的A-T含量和至少 650C的Tm,并且不形成明顯的二級DNA或RNA結(jié)構(gòu)。在一些實施方式里,兩個或多個可退火接頭序列具有低G-C含量和至少65°C的Tm,并包含基序δ'-ΑΝΝΝΝΝΝΝΝΑΝΝΝΑΑΝΤΑΝΝΤΤΝΑΝΑ-Β’,其中 A 代表腺嘌呤, N 代表任何核苷酸,而 T 代表胸腺嘧啶。 在一些實施方式里,可退火接頭序列LA的核酸序列選自SEQ ID NO :9-23及其互補物。在一些實施方式里,可退火接頭序列LB的核酸序列選自SEQ ID NO :9-23及其互補物。在一些實施方式里,可退火接頭序列LA和可退火接頭序列LB的核酸序列選自SEQ ID NO :9_23及其互補物。多個組分多核苷酸的順序裝配可以通過可退火接頭序列的選擇來控制,所述可退火接頭序列在裝配載體中側(cè)鄰于DNA片段。從而,在一些實施方式里,為了確保組分多核苷酸能夠以有序方式被裝配進(jìn)去,在特定裝配載體中的可退火接頭序列/可退火接頭序列對的序列是不互補的。相似的,在一些實施方式里,在特定裝配載體中的引物結(jié)合片段/可退火接頭序列對的序列是不互補的。在一個特別的實施方式里,限制性酶切位點RA和RB可以被同樣的限制性內(nèi)切酶切斷,以利于從裝配載體中切除組分多核苷酸。在一些實施方式里,限制性酶切位點RA或 RB可以被限制性內(nèi)切酶切斷并留下5’或3’突出。在另一個實施方式里,限制性酶切位點 RA或RB被限制性內(nèi)切酶切斷并留下平末端。在一些實施方式里,限制性酶切位點RA和RB 可以被同樣的限制性內(nèi)切酶切斷。在另外的實施方式里,限制性酶切位點RA和RB可以被 IIS型限制性內(nèi)切酶切斷。在一些實施方式里,限制性酶切位點RA和RB可以被相同的IIS 型限制性內(nèi)切酶切斷。在一個特別的實施方式里,限制性酶切位點RA和RB被SapI或LguI 限制性內(nèi)切酶所切斷。
在另一個方面,本發(fā)明提供輸入載體,其用于制備包含DNA片段的裝配載體。在一些實施方式里,所述輸入載體是環(huán)形多核苷酸并以5’至3’的方向包含限制性酶切位點RA,限制性酶切位點RY,DNA片段D,限制性酶切位點RZ,可退火接頭序列LB,和限制性酶切位點RB (即,5,-RA-RY-D-RZ-LB-RB-3,)。在一些實施方式里,所述輸入載體是環(huán)形多核苷酸并以5’至3’的方向包含限制性酶切位點RA, 可退火接頭序列LA,限制性酶切位點RY,DNA片段D,限制性酶切位點RZ,和限制性酶切位點RB(即,5,-RA-LA-RY-D-RZ-RB-3,)。在一些實施方式里,所述輸入載體是環(huán)形多核苷酸并以5’至3’的方向包含限制性酶切位點RA,可退火接頭序列LA,限制性酶切位點RY,DNA片段D,限制性酶切位點RZ,可退火接頭序列LB,和限制性酶切位點RB ( S卩,5,-RA-LA-RY-D-RZ-LB-RB-3')。在一些實施方式里,所述輸入載體是環(huán)形多核苷酸并以5’至3’的方向包含限制性酶切位點RA,引物結(jié)合片段PA,限制性酶切位點RY,DNA片段D,限制性酶切位點RZ,可退火接頭序列LB,和限制性酶切位點 RB(即,5,-RA-PA-RY-D-RZ-LB-RB-3,)。在一些實施方式里,所述輸入載體是環(huán)形多核苷酸并以5’至3’的方向包含限制性酶切位點RA,可退火接頭序列LA,限制性酶切位點RY, DNA片段D,限制性酶切位點RZ,引物結(jié)合片段PB,和限制性酶切位點RB(即, 5,-RA-LA-RY-D-RZ-PB-RB-3‘)。圖IA提供了示例性的輸入載體。用能夠切斷RY和RZ的一種或多種限制性內(nèi)切酶消化輸入載體可以建立能夠接受 DNA片段的線形載體。DNA片段通過標(biāo)準(zhǔn)克隆技術(shù)連接入RY和RZ位點以形成本發(fā)明的裝配載體。在一些實施方式里,輸入載體的限制性酶切位點RY和RZ可以被同樣的限制性內(nèi)切酶切斷。在一些實施方式里,輸入載體的限制性酶切位點RY和RZ可以被IIS型限制性內(nèi)切酶切斷。在一些實施方式里,輸入載體的限制性酶切位點RY和RZ可以被相同的IIS型限制性內(nèi)切酶切斷。在一個特別的實施方式里,所述IIS型限制性內(nèi)切酶是khl或Mlyl。在一些實施方式里,輸入載體的限制性酶切位點RA和RB可以被同樣的限制性內(nèi)切酶切斷。在一些實施方式里,輸入載體的限制性酶切位點RA和RB可以被IIS型限制性內(nèi)切酶切斷。在一些實施方式里,輸入載體的限制性酶切位點RA和RB可以被相同的IIS型限制性內(nèi)切酶切斷。在一個特別的實施方式里,所述IIS型限制性內(nèi)切酶是SapI或Lgul。在另一方面,本發(fā)明提供裝配組合物,其包含多種裝配載體,所述裝配載體用于從多種組分多核苷酸裝配為一種或多種裝配好的多核苷酸。在一些實施方式里,所述裝配組合物包含(a) 一個或多個第一核酸分子,其中每個第一核酸分子是環(huán)形的并以5’至3’方向包含第一限制性酶切位點RAtl、選自組Dtl的任意的DNA片段、可退火接頭序列LBtl,和第二限制性酶切位點RBtl ;(b) 一個或多個中間核酸分子,其中每個中間核酸分子η是環(huán)形的并以5’至3’的方向包含第一限制性酶切位點RAn、第一可退火接頭序列LAn、選自組Dn的任意DNA片段、 第二可退火接頭序列LBn,和第二限制性酶切位點RBn,其中η表示從1到中間核酸分子數(shù)目的整數(shù);和(c) 一個或多個最后核酸分子,其中每個最后核酸分子是環(huán)形的并以5’至3’的方向包含第一限制性酶切位點RAm、第一可退火接頭序列LAm、選自組Dm的任意DNA片段、和第二限制性酶切位點RBm,其中m表示比中間核酸分子數(shù)目大1的整數(shù);
其中切斷限制性酶切位點RAtl至RBm,變性所獲得的線形核酸分子,每個可退火接頭序列LB(p_d能夠與可退火接頭序列LAp的互補物雜交,其中η是在1到(m-Ι)范圍內(nèi)的整數(shù),其中P表示一個從1到m的整數(shù),并且其中每個組Dtl,. . . Dn,. . . Dffl獨立地由一個或多個 DNA片段組成。在某些實施方式里,一個或多個第一核酸分子進(jìn)一步包含一個引物結(jié)合片段PA 位于所述選自組Dtl的DNA片段的5’位置。在某些實施方式里,一個或多個最后核酸分子進(jìn)一步包含一個引物結(jié)合片段PB位于所述選自組Dm的DNA片段的3’位置。在某些實施方式里,裝配組合物包含兩個或更多個中間核酸分子。在某些實施方式里,裝配組合物包含三個或更多個中間核酸分子。在某些實施方式里,裝配組合物包含四個或更多個中間核酸分子。在某些實施方式里,裝配組合物包含五個或更多個中間核酸分子。在某些裝配方式里,所述組合物包含六個或更多個中間核酸分子。在某些實施方式里, 裝配組合物包含七個或更多個中間核酸分子。在某些實施方式里,裝配組合物包含八個或更多個中間核酸分子。在某些實施方式里,裝配組合物包含九個或更多個中間核酸分子。在某些實施方式里,裝配組合物包含十個或更多個中間核酸分子。在某些實施方式里,裝配組合物包含十五個或更多個中間核酸分子。在某些實施方式里,裝配組合物包含二十個或更多個中間核酸分子。在某些實施方式里,m等于1。在某些實施方式里,m等于2。在某些實施方式里, m等于3。在某些實施方式里,m等于4。在某些實施方式里,m等于5。在某些實施方式里, m等于6。在某些實施方式里,m等于7。在某些實施方式里,m等于8。在某些實施方式里, m等于9。在某些實施方式里,m等于10。在某些實施方式里,m等于或大于10。在一些實施方式里,切斷RAtl至RBm的限制性酶切位點和變形所獲得的線形核酸分子之后,相比于裝配組合物中的其它可退火接頭序列或它們的互補物,每個可退火接頭序列LB(p_d能夠選擇性地與可退火接頭序列LAp的互補物雜交。在一些實施方式里,每個可退火接頭序列L(p_d在序列上與可退火接頭序列LAp相同。在一個特別的實施方式里,RAc^ 1 的限制性酶切位點可以被同樣的限制性內(nèi)切酶切斷從而利于從裝配載體中切除組分多核苷酸。在一些實施方式里,RAtl至?。苛嫉南拗菩悦盖形稽c可以被SapI和/或LguI限制性內(nèi)切酶切斷。在另一方面,本發(fā)明提供包含多種線形核酸分子的組分組合物,其中所述線形核酸分子能通過用一種或多種能夠切斷RAtl至RBm的限制性酶切位點的限制性內(nèi)切酶消化裝配組合物而形成,其中所述裝配組合物包含(a) 一個或多個第一核酸分子,其中每個第一核酸分子是環(huán)形的并以5’至3’方向包含第一限制性酶切位點RAtl,選自組Dtl的任意DNA片段,可退火接頭序列LBtl,和第二限制性酶切位點RBtl ;(b) 一個或多個中間核酸分子,其中每個中間核酸分子η是環(huán)形的并以5’至3’的方向包含第一限制性酶切位點RAn,第一可退火接頭序列LAn,選自組Dn的任意DNA片段, 第二可退火接頭序列LBn,和第二限制性酶切位點RBn,其中η表示從1到中間核酸分子數(shù)目的整數(shù);和(c) 一個或多個最后核酸分子,其中每個最后核酸分子是環(huán)形的并以5’至3’的方向包含第一限制性酶切位點RAm,第一可退火接頭序列LAm,選自組Dm的任意DNA片段,第二限制性酶切位點RBm,其中m表示比中間核酸分子數(shù)目大1的整數(shù);其中切斷RAtl至RBm的限制性酶切位點,變性所獲得的線形核酸分子之后,每個可退火接頭序列LB(p_d能夠與可退火接頭序列LAp的互補物雜交,其中η是在1到(m-Ι)范圍內(nèi)的整數(shù),其中P表示一個從1到m的整數(shù),并且其中每個組Dtl,. . . Dn,. . . Dffl由一個或多個 DNA片段組成。在某些實施方式里,一個或多個第一核酸分子進(jìn)一步包含引物結(jié)合片段PA位于選自組Dtl的DNA片段的5’位置。在某些實施方式里,一個或多個最后核酸分子進(jìn)一步包含引物結(jié)合片段PB位于選自組Dm的DNA片段的3’位置。在某些實施方式里,組分組合物包含兩個或更多個中間核酸分子。在某些實施方式里,組分組合物包含三個或更多個中間核酸分子。在某些實施方式里,組分組合物包含四個或更多個中間核酸分子。在某些實施方式里,組分組合物包含五個或更多個中間核酸分子。在某些裝配方式里,所述組合物包含六個或更多個中間核酸分子。在某些實施方式里, 組分組合物包含七個或更多個中間核酸分子。在某些實施方式里,組分組合物包含八個或更多個中間核酸分子。在某些實施方式里,組分組合物包含九個或更多個中間核酸分子。在某些實施方式里,組分組合物包含十個或更多個中間核酸分子。在某些實施方式里,組分組合物包含十五個或更多個中間核酸分子。在某些實施方式里,組分組合物包含二十個或更多個中間核酸分子。在某些實施方式里,m等于1。在某些實施方式里,m等于2。在某些實施方式里, m等于3。在某些實施方式里,m等于4。在某些實施方式里,m等于5。在某些實施方式里, m等于6。在某些實施方式里,m等于7。在某些實施方式里,m等于8。在某些實施方式里, m等于9。在某些實施方式里,m等于10。在某些實施方式里,m等于或大于10。在另一方面,本發(fā)明提供一種用于依照本發(fā)明提供的方法來裝配多種多核苷酸的試劑盒。在一些實施方式里,所述試劑盒包含(a) 一種或多種本文描述的輸入載體;(b) 一種或多種能夠切斷輸入載體的限制性酶切位點RA和RB的限制性內(nèi)切酶;和(c) 一種或多種能夠切斷輸入載體的限制性酶切位點RY和RZ的限制性內(nèi)切酶。在另一方面,本發(fā)明提供一種核酸分子文庫。在一些實施方式里,所述文庫的核酸分子包含第一限制性酶切位點RA,DNA片段D,可退火接頭序列LB,和第二限制性酶切位點 RB。在一些實施方式里,所述文庫的核酸分子包含第一限制性酶切位點RA,引物結(jié)合片段 PA,DNA片段D,可退火接頭序列LB,和第二限制性酶切位點RB。在一些實施方式里,所述文庫的核酸分子包含第一限制性酶切位點RA,可退火接頭序列LA,DNA片段D,可退火接頭序列LB,和第二限制性酶切位點RB。在一些實施方式里,所述文庫的核酸分子包含第一限制性酶切位點RA,可退火接頭序列LA,DNA片段D,和第二限制性酶切位點RB。在一些實施方式里,所述文庫的核酸分子包含第一限制性酶切位點RA,可退火接頭序列LA,DNA片段D,引物結(jié)合片段PB,和第二限制性酶切位點RB。在一些實施方式里,所述文庫包含下列每種載體的至少一種(a)環(huán)形多核苷酸組成的載體,所述多核苷酸以5’至3’的方向包含限制性酶切位點RA,DNA片段D,可退火接頭序列LB,和限制性酶切位點RB ;(b)環(huán)形多核苷酸組成的載體,所述多核苷酸以5’至3’的方向包含限制性酶切位點RA,可退火接頭序列LA,DNA片段D,可退火接頭序列LB,和限制性酶切位點RB ;和
(c)環(huán)形多核苷酸組成的載體,所述多核苷酸以5’至3’的方向包含限制性酶切位點RA,可退火接頭序列LA,DNA片段D,和限制性酶切位點RB。。在一些實施方式里,所述文庫包含下列每種載體的至少一種(a)環(huán)形多核苷酸組成的載體,所述多核苷酸以5’至3’的方向包含限制性酶切位點RA,引物結(jié)合片段PA,DNA片段D,可退火接頭序列LB,和限制性酶切位點RB ;(b)環(huán)形多核苷酸組成的載體,所述多核苷酸以5’至3’的方向包含限制性酶切位點RA,可退火接頭序列LA,DNA片段D,可退火接頭序列LB,和限制性酶切位點RB ;和(c)環(huán)形多核苷酸組成的載體,所述多核苷酸以5’至3’的方向包含限制性酶切位點RA,可退火接頭序列LA,DNA片段D,引物結(jié)合片段PB,和限制性酶切位點RB。。在一些實施方式里,所述DNA片段D包含核酸序列,所述核酸序列選自選擇性標(biāo)記,啟動子,基因組靶向序列,編碼表位標(biāo)簽的核酸序列,和編碼感興趣的基因的核酸序列, 編碼終止密碼子和IacZ的核酸序列。在一些實施方式里,所述文庫包含下列每種核酸分子的至少一種(a)第一核酸分子,其中所述第一核酸分子是環(huán)形并以5’至3’方向包含第一限制性酶切位點RAtl, DNA片段Dtl,可退火接頭序列LBtl,和第二限制性酶切位點RBtl ;(b)中間核酸分子,其中所述中間核酸分子η是環(huán)形的并以5’至3’的方向包含 第一限制性酶切位點RAn,第一可退火接頭序列LAn,DNA片段Dn,第二可退火接頭序列LBn, 和第二限制性酶切位點RBn,并且其中η表示從1到中間核酸分子數(shù)目的整數(shù);和(c)最后核酸分子,其中所述最后核酸分子是環(huán)形的并以5’至3’的方向包含第一限制性酶切位點RAm,可退火接頭序列LAm,DNA片段Dm,第二限制性酶切位點RBm,其中m 表示比中間核酸分子數(shù)目大1的整數(shù);其中切斷RAtl至RBm的限制性酶切位點,變性所獲得的線形核酸分子之后,每個可退火接頭序列LB(p_d能夠與可退火接頭序列LAp的互補物雜交,其中η是在1到(m-Ι)范圍內(nèi)的整數(shù),其中P表示一個從1到m的整數(shù)。在一些實施方式里,第一核酸分子進(jìn)一步包含引物結(jié)合片段PA位于選自Dtl的DNA片段的5’位置。在一些實施方式里,最后核酸分子進(jìn)一步包含引物結(jié)合片段PB位于選自Dm的DNA片段的3,位置。在某些實施方式里,所述文庫包含兩種或更多種中間核酸分子。在某些實施方式里,所述文庫包含三種或更多種中間核酸分子。在某些實施方式里,所述文庫包含四種或更多種中間核酸分子。在某些實施方式里,所述文庫包含五種或更多種中間核酸分子。在某些裝配方式里,所述文庫包含六種或更多種中間核酸分子。在某些實施方式里,所述文庫包含七種或更多種中間核酸分子。在某些實施方式里,所述文庫包含八種或更多種中間核酸分子。在某些實施方式里,所述文庫包含九種或更多種中間核酸分子。在某些實施方式里, 所述文庫包含十種或更多種中間核酸分子。在某些實施方式里,所述文庫包含十五種或更多種中間核酸分子。在某些實施方式里,所述文庫包含二十種或更多種中間核酸分子。在某些實施方式里,m等于1。在某些實施方式里,m等于2。在某些實施方式里, m等于3。在某些實施方式里,m等于4。在某些實施方式里,m等于5。在某些實施方式里, m等于6。在某些實施方式里,m等于7。在某些實施方式里,m等于8。在某些實施方式里, m等于9。在某些實施方式里,m等于10。在某些實施方式里,m等于或大于10。在另一方面,本發(fā)明提供從多種組分多核苷酸裝配為一種或多種裝配好的多核苷酸的方法,包含如下步驟(a)用一種或多種限制性內(nèi)切酶消化裝配組合物以產(chǎn)生組分組合物,所述裝配組合物包含(i) 一個或多個第一核酸分子,其中每個第一核酸分子是環(huán)形的并以5’至3’方向包含第一限制性酶切位點RAtl,選自組PA的任意引物結(jié)合片段,選自組Dtl的任意DNA片段,可退火接頭序列LBtl,和第二限制性酶切位點RBtl ;(ii) 一個或多個中間核酸分子,其中每個中間核酸分子η是環(huán)形的并以5’至3’ 的方向包含第一限制性酶切位點RAn,第一可退火接頭序列LAn,選自組Dn的任意DNA片段,第二可退火接頭序列LBn,和第二限制性酶切位點RBn,其中η表示從1到中間核酸分子數(shù)目的整數(shù);和(iii) 一個或多個最后核酸分子,其中每個最后核酸分子是環(huán)形的并以5’至3’的方向包含第一限制性酶切位點RAm,第一可退火接頭序列LAm,選自組Dm的任意DNA片段, 選自組PB的任意引物結(jié)合片段,第二限制性酶切位點RBm,其中m表示比中間核酸分子數(shù)目大1的整數(shù);其中切斷RAtl至RBm的限制性酶切位點,變性所獲得的線形核酸分子之后,每個可退火接頭序列LB(p_d能夠與可退火接頭序列LAp的互補物雜交,其中η是在1到(m-1) 范圍內(nèi)的整數(shù),其中P表示一個從1到m的整數(shù),并且其中每個組Dtl,. . . Dn,. . . Dffl由一個或多個DNA片段組成;其中所述一種或多種限制性內(nèi)切酶能夠切斷RAtl至RBm的限制性酶切位點;和(b)使組分組合物接觸DNA聚合酶,三磷酸脫氧核糖核苷和一個或多個第一引物和一個或多個第二引物,在適合核酸分子變性的條件下,退火可退火接頭序列LB(p_d至可退火接頭序列LAp,并從此延伸;其中每個所述第一引物能夠與選自組PA的所述引物結(jié)合片段之一雜交,而每個第二引物能夠與選自組PB的所述引物結(jié)合片段之一雜交;并且將所述組分組合物進(jìn)行聚合酶鏈?zhǔn)椒磻?yīng),其中以5’到3’方向包含分別選自組D。,...Dn,...和Dm的一個DNA片段的多核苷酸被裝配起來,P表示從1到m的整數(shù)。在某些實施方式里,裝配組合物包含兩個或更多個中間核酸分子。在某些實施方式里,裝配組合物包含三個或更多個中間核酸分子。在某些實施方式里,裝配組合物包含四個或更多個中間核酸分子。在某些實施方式里,裝配組合物包含五個或更多個中間核酸分子。在某些裝配方式里,所述組合物包含六個或更多個中間核酸分子。在某些實施方式里, 裝配組合物包含七個或更多個中間核酸分子。在某些實施方式里,裝配組合物包含八個或更多個中間核酸分子。在某些實施方式里,裝配組合物包含九個或更多個中間核酸分子。在某些實施方式里,裝配組合物包含十個或更多個中間核酸分子。在某些實施方式里,裝配組合物包含十五個或更多個中間核酸分子。在某些實施方式里,裝配組合物包含二十個或更多個中間核酸分子。在某些實施方式里,m等于1。在某些實施方式里,m等于2。在某些實施方式里, m等于3。在某些實施方式里,m等于4。在某些實施方式里,m等于5。在某些實施方式里, m等于6。在某些實施方式里,m等于7。在某些實施方式里,m等于8。在某些實施方式里, m等于9。在某些實施方式里,m等于10。在某些實施方式里,m等于或大于10。在一些實施方式里,裝配組合物包含一個第一核酸分子和一個最后核酸分子。在其它實施方式里,裝配組合物包含多于一個第一核酸分子和多于一個最后核酸分子,這種裝配方法提供了以組合的方式將多種組分多核苷酸有序裝配為多個裝配好的多核苷酸的有序裝配方法。在某些實施方式里,裝配組合物包含至少兩種核酸分子,所述核酸分子包含相同的可退火接頭序列LA和LB,和相同的引物結(jié)合片段PA或PB,或者相同的可退火接頭序列對LA和LB,或者相同的可退火接頭序列/引物結(jié)合片段對LA和PB,或者LB和PA。在另一方面,本發(fā)明提供產(chǎn)生包含裝配好的多核苷酸的宿主細(xì)胞的方法。在一些實施方式里,所述方法包含用由本文描述的多核苷酸裝配方法產(chǎn)生的裝配好的多核苷酸轉(zhuǎn)化宿主細(xì)胞。在其它實施方式里,所述方法包含用由本文描述的多核苷酸裝配方法產(chǎn)生的多種裝配好的多核苷酸轉(zhuǎn)化宿主細(xì)胞。在一個特別的實施方式里,所述宿主細(xì)胞通過同源重組將兩種或多種裝配好的多核苷酸組合進(jìn)入一種或多種組合的多核苷酸。在另外的實施方式里,所述方法包含用多個組分多核苷酸轉(zhuǎn)化所述宿主細(xì)胞并且允許宿主細(xì)胞通過同源重組產(chǎn)生一種或多種裝配好的組合多核苷酸。在另一方面,本發(fā)明提供產(chǎn)生多種宿主細(xì)胞的方法,所述宿主細(xì)胞包含大量裝配好的多核苷酸。在一些實施方式里,所述多種宿主細(xì)胞通過用包含多種裝配好的多核苷酸的組合物轉(zhuǎn)化宿主細(xì)胞而產(chǎn)生,其中所述裝配好的多核苷酸由組分多核苷酸組合裝配而產(chǎn)生。在其它實施方式里,所述多種宿主細(xì)胞通過用包含多種裝配好的多核苷酸的組合物轉(zhuǎn)化宿主細(xì)胞而產(chǎn)生,其中所述裝配好的多核苷酸的至少兩種包含選擇性標(biāo)記的非功能性片段,其通過宿主細(xì)胞介導(dǎo)的同源重組而產(chǎn)生功能性選擇性標(biāo)記,然后篩選包含組合多核苷酸的宿主細(xì)胞。在另外的實施方式里,所述多種宿主細(xì)胞通過用組分組合物轉(zhuǎn)化宿主細(xì)胞的組合方法而產(chǎn)生,其中所述組分組合物包含多種組分多核苷酸,至少兩種組分多核苷酸包含同樣的可退火接頭序列LA或LB或者同樣的可退火序列對LA和LB,然后篩選包含裝配好的多核苷酸的宿主細(xì)胞。在另一方面,本發(fā)明提供具有選自SEQ ID NO :1_25的序列的多核苷酸。在另一方面,本發(fā)明提供包含選自SEQ ID NO :1_25的一個或多個序列的多核苷酸。
4.
圖IA提供了用于制備本發(fā)明的裝配載體的輸入載體的示意圖。該載體包含限制性酶切位點RAtl,引物結(jié)合片段PA或可退火接頭序列LA,限制性酶切位點RY,DNA片段D,限制性酶切位點RZ,引物結(jié)合片段PB或可退火接頭序列LB,和限制性酶切位點RB。圖IB提供了制備輸入載體的示例性方法,所述輸入載體接受DNA片段以形成裝配載體。示例性地,RY = RZ = khl。用能夠產(chǎn)生平末端的IIS型限制性內(nèi)切酶khl消化, 導(dǎo)致載體與連接位點分離從并開放從而與DNA片段(D)融合。D通過平末端連接進(jìn)入輸入載體可以通過傳統(tǒng)方法實現(xiàn),并施用例如T4DNA連接酶。圖2展示了包含多個裝配載體(第一,中間,和最后)的裝配組合物的示意圖,分別包含感興趣的DNA片段(Dtl,Dn,Dm)。第一核酸分子包含第一限制性酶切位點RAtl,引物結(jié)合片段PA,DNA片段Dtl,可退火接頭序列LBtl,和第二限制性酶切位點RBtltl —個或多個中間核酸分子包含第一限制性酶切位點RAn,第一可退火接頭序列LAn,DNA片段Dn,第二可退火接頭序列LBn,和第二限制性酶切位點RBn,其中η表示從1到中間核酸分子數(shù)目的整數(shù);而最后核酸分子包含第一限制性酶切位點RAm,可退火接頭序列LAm,DNA片段Dm,引物結(jié)合片段PB,第二限制性酶切位點RBm,其中m表示比中間核酸分子數(shù)目大1的整數(shù)。
圖3展示了裝配的示例性方法,S卩,從四種(4)組分多核苷酸“縫合”為裝配好的多核苷酸。將包含用于裝配的DNA片段的裝配載體注入單獨一個試管中并用SapI消化以從裝配載體骨架中釋放組分多核苷酸片段。在SapI加熱失活之后,所述組分多核苷酸片段用于變性條件,繼之以退火條件且足夠互補可退火接頭對的雜交。在DNA聚合酶和dNTP存在下的引物延伸之后,加入與PA和PB互補的引物,繼之以傳統(tǒng)的PCR擴增。作為裝配反應(yīng)的結(jié)果,產(chǎn)生了包含組分多核苷酸Dtl,D1,D2,和D3以5’到3’方向裝配起來的裝配好的多核苷酸。 圖4顯示了 pRYSE載體圖。圖5顯示了通過裝配2到4組分多核苷酸(裝配表7中的1到6)而獲得的裝配好的多核苷酸,使用不同的方法以移除SapI限制性內(nèi)切酶(柱純化或加熱失活),不同的裝配載體DNA濃度(5ng (低DNA濃度)或50ng (高DNA濃度)的最小片段,和相等摩爾濃度的所有其它片段),和PCR擴增的不同退火溫度和72°C )。圖6顯示了通過裝配6或9組分多核苷酸(裝配表7中的7,和13到16)而獲得的裝配好的多核苷酸,使用不同的DNA聚合酶(Phusion (New Engl和Biolabs,Ipswich,MA) 和 PfuUltraII(Stratagene/Agilent, La Jolla, CA))。圖7顯示了 pMULE載體圖。該pMULE輸入載體不同于pRYSE輸入載體之處在于它缺少引物結(jié)合片段或可退火接頭序列。圖8顯示了通過宿主細(xì)胞介導(dǎo)的同源重組來組合裝配好的多核苷酸進(jìn)入組合多核苷酸的示例性方法,其中組合多核苷酸被整合進(jìn)入宿主細(xì)胞的染色體。裝配好的多核苷酸A包含編碼選擇性標(biāo)記的第一非功能性片段的DNA片段Dml和編碼上游基因組靶向序列的DNA片段Dtllt5裝配好的多核苷酸B包含編碼選擇性標(biāo)記的第二非功能性片段的DNA片段Dm2和編碼下基因組靶向序列的DNA片段DQ2。宿主細(xì)胞在DNA片段Dml和Dm2的同源區(qū)域聯(lián)合裝配好的多核苷酸A和裝配好的多核苷酸B,以形成包含功能性選擇性標(biāo)記的組合多核苷酸,并利用DNA片段Dtll和Dtl2編碼的基因組靶向序列來將組合多核苷酸通過同源重組插入到其染色體中。圖9顯示了通過宿主細(xì)胞中同源重組而產(chǎn)生裝配好的多核苷酸和將所述裝配好的多核苷酸整合進(jìn)入宿主細(xì)胞的染色體的示例性方法。第一步,用限制性內(nèi)切酶消化包含裝配載體的裝配組合物,導(dǎo)致組分多核苷酸從裝配載體骨架中切除出來。第二步,組分多核苷酸被引入宿主細(xì)胞,在這里它們在可退火接頭序列的同源區(qū)域結(jié)合起來從而形成裝配好的多核苷酸,并且該裝配好的多核苷酸整合進(jìn)入宿主細(xì)胞的染色體。圖10顯示了在同一個反應(yīng)中從七種(7)組分多核苷酸裝配得到多種裝配好的多核苷酸的示例性方法。將包含用于裝配的DNA片段的裝配載體注入一個單獨的試管,并用 SqpI消化以從裝配載體骨架中釋放組分多核苷酸。在SapI加熱失活之后,所述組分多核苷酸片段用于變性條件,繼之以退火條件且足夠互補可退火接頭對的雜交。在DNA聚合酶和dNTP存在下的引物延伸之后,加入與PA和PB互補的引物,繼之以傳統(tǒng)的PCR擴增。作為裝配反應(yīng)的結(jié)果,產(chǎn)生了包含組分多核苷酸Dciiai2,D1/2,D3,和D4v42以5’到3’方向裝配起來的裝配好的多核苷酸。
圖11顯示了產(chǎn)生包含組合的組合多核苷酸的多種宿主細(xì)胞的示例性方法。裝配好的多核苷酸Al和A2,分別包含相同的上游基因組靶向序列和相同的選擇性標(biāo)記的第一非功能性部分,和裝配好的多核苷酸Bl和B2,分別包含相同的下游基因組靶向序列和相同的選擇性標(biāo)記的第二非功能性部分,通過宿主細(xì)胞介導(dǎo)的同源重組組合性結(jié)合起來一產(chǎn)生 4種不同的組合多核苷酸,Al/Bl, A1/B2, A2/B1,和A2/B2,分別包含功能性選擇性標(biāo)記,其能夠被插入染色體以產(chǎn)生四種不同的宿主細(xì)胞。圖12A顯示了實施例10中的組分多核苷酸,所述組分多核苷酸用于高通量產(chǎn)生組合的裝配好的多核苷酸和包含組合的裝配好的多核苷酸和組合多核苷酸的酵母細(xì)胞,以及所期望的裝配好的多核苷酸和組合多核苷酸。us =上游基因組靶向序列,DS =下游基因組靶向序列,P =多種啟動子序列,G =多種蛋白質(zhì)編碼序列,URA =選擇性標(biāo)記的5’片段, RA3 =選擇性標(biāo)記的3,片段,PA =引物結(jié)合片段RneI-5,,PB =引物結(jié)合片段RneI-3,, LB0 =可退火接頭序列RYSE 2,LAnl =可退火接頭序列RYSE 2,LBnl =可退火接頭序列RYSE 15,LAn2 =可退火接頭序列RYSE 3,LBn2 =可退火接頭序列RYSE16,LAn3 =可退火接頭序列 RYSE 15,LBn3 =可退火接頭序列RYSE 3,LAn4 =可退火接頭序列RYSE 16,LBn4 =可退火接頭序列RYSE 4,LAml =可退火接頭序列RYSE 3,LAm2 =可退火接頭序列RYSE 4,LAm3 =可退火接頭序列RYSE 3。圖12B顯示了示例性的裝配好的多核苷酸(方框內(nèi)),其由實施例10所描述的方法產(chǎn)生并在瓊脂糖凝膠上拆分。圖12C顯示了如實施例10所描述獲得的示例性細(xì)胞克隆的酶切分析。圖13A顯示了實施例11所用的裝配好的多核苷酸和組分多核苷酸,及通過裝配和宿主細(xì)胞的染色體整合而獲得的期望的染色體位點。圖13B顯示了由實施例11產(chǎn)生的包含染色體整合了的裝配好的多核苷酸的酵母細(xì)胞轉(zhuǎn)化株的cPCR分析結(jié)果。圖14顯示了實施例12使用的組分多核苷酸,其用于高通量產(chǎn)生包含染色體整合了的組合的裝配好的多核苷酸和組合的組合多核苷酸的酵母細(xì)胞,和通過裝配以及宿主細(xì)胞介導(dǎo)的同源重組而組合后獲得的組合多核苷酸。us =上游基因組靶向序列,DS =下游基因組靶向序列,P =多種啟動子序列,G =多種蛋白質(zhì)編碼序列,URA =選擇性標(biāo)記的5’片段,RA3=選擇性標(biāo)記的3,片段,PA=引物結(jié)合片段RneI-5,,PB=引物結(jié)合片段RneI-3,, LB0 =可退火接頭序列RYSE 2,LAnl =可退火接頭序列RYSE 2,LBnl =可退火接頭序列RYSE 15,LAn2 =可退火接頭序列RYSE 3,LBn2 =可退火接頭序列RYSE16,LAn3 =可退火接頭序列 RYSE 15,LBn3 =可退火接頭序列RYSE 3,LAn4 =可退火接頭序列RYSE 16,LBn4 =可退火接頭序列RYSE 4,LAml =可退火接頭序列RYSE 3,LAm2 =可退火接頭序列RYSE 4,LAm3 =可退火接頭序列RYSE 3。5.發(fā)明詳述5. 1 定義如本文所述,術(shù)語“多核苷酸”是指由核苷酸單位組成的聚合物,如本領(lǐng)域技術(shù)人員所理解的。優(yōu)選的核苷酸單位包括但不限于包含腺嘌呤(A),烏嘌呤(G),胞嘧啶(C),胸腺嘧啶(T),和尿嘧啶(U)。有用的修飾的核苷酸單位包括但不限于4-乙酰胞苷,5_(羧基羥基甲基)尿苷,2-0-甲基胞苷,5-羧基甲基氨基甲基-2-硫代尿苷,5-羧基甲基氨基-甲基尿苷,二氫尿苷,2-0-甲基假尿苷,2-0-甲基烏苷,肌苷,N6-異戊基腺苷,1-甲基腺苷, 1-甲基假尿苷,1-甲基烏苷,1-甲基肌苷,2,2_ 二甲基烏苷,2-甲基腺苷,2-甲基烏苷, 3-甲基胞苷,5-甲基胞苷,N6-甲基腺苷,7-甲基烏苷,5-甲基氨基甲基尿苷,5-甲氧基氨基甲基-2-硫代尿苷,5-甲氧基尿苷,5-甲氧羰基甲基-2-硫代尿苷,5-甲氧羰基甲基尿苷,2-甲基硫代-N6-異戊基腺苷,尿苷-5-氧乙酸-甲酯,尿苷-5-氧乙酸,wybutoxosine, wybutosine,假尿苷,q核苷,2_硫代胞苷,5_甲基_2_硫代尿苷,2_硫代尿苷,4_硫代尿苷, 5-甲基尿苷,2-0-甲基-5-甲基尿苷,2-0-甲基尿苷,等等。多核苷酸包括天然存在的核酸例如脫氧核糖核酸(“DNA”)和核糖核酸(“RNA”),以及核酸類似物。核酸類似物包括包含以下的物質(zhì)非天然存在的堿基,以與天然存在的二磷酸鍵不同的方式參與與其它核苷的連接的核苷,或包含通過二磷酸鍵之外的連接而連接的堿基。因此,核酸類似物包含,示例性的和非限制性的,硫代磷酸酯,二硫代磷酸酯,磷酸三酯,氨基磷酸酯,硼烷磷酸酯,甲基磷酸酯,手性-甲基磷酸酯,2-0-甲基核苷酸,肽-核酸(PNA),等等。如本文所述,“組分多核苷酸”是指可以用本文描述的多核苷酸裝配方法裝配在一起而形成“裝配好的多核苷酸”的多核苷酸序列。當(dāng)多種裝配載體被一種或多種限制性內(nèi)切酶消化而從裝配載體中釋放組分多核苷酸之后,獲得的組分多核苷酸的群體能夠包含將被裝配進(jìn)入裝配好的多核苷酸的所有DNA片段。如本文所述,“裝配好的多核苷酸”是指由本文所述的多核苷酸裝配方法所制造的多核苷酸。所述裝配好的多核苷酸能夠包含兩種或更多組分多核苷酸。在一些實施方式里, 裝配好的多核苷酸包含2,3,4, 5,6, 7,8,9,10,11,12,13,14,15或更多組分多核苷酸。裝配好的多核苷酸長度可以在大約100到大約20000個核苷酸范圍內(nèi)。在一些實施方式里,裝配好的多核苷酸的長度在大約200到大約10000,大約200到大約8000,大約200到大約 5000,大約200到大約3000,或大約200到大約1000個核苷酸范圍內(nèi)。在其它實施方式里, 裝配好的多核苷酸的長度在大約200到大約2000,大約2000到大約5000,大約5000到大約10000,大約10000到大約20000,或大于20000個核苷酸的范圍內(nèi)。本文使用常規(guī)標(biāo)注來描述多核苷酸序列單鏈多核苷酸序列的左手末端是5’ -末端;雙鏈多核苷酸序列的左手方向是指向其5’ -方向。如本文所述,術(shù)語“DNA片段”,在下文實施例中可選地稱為“Bit”,指任何分離的或未分離的DNA分子。有用的實例包括但不限于蛋白質(zhì)編碼序列,報告基因,熒光標(biāo)記編碼序列,啟動子,增強子,終止子,內(nèi)含子,外顯子,聚-A尾,多克隆位點,核酸定位信號,mRNA 穩(wěn)定信號,選擇性標(biāo)記,整合位點,表位標(biāo)簽編碼序列,降解信號,或任何其它天然存在或人工合成的DNA分子。在一些實施方式里,DNA片段可以是天然來源的??蛇x地,DNA片段可以是完全的合成來源的,體外合成。進(jìn)一步,DNA片段可以包含任何分離的天然存在的DNA 分子的組合,或任何分離的天然存在的DNA分子和人工合成的DNA分子的組合。例如,DNA 片段可以包含異源啟動子可操作地連接蛋白質(zhì)編碼序列,蛋白質(zhì)編碼序列連接聚-A尾,蛋白質(zhì)編碼序列在框內(nèi)連接表位標(biāo)簽編碼序列,等等?!盎パa”是指兩個多核苷酸的相互作用的表面拓?fù)鋵W(xué)上相容或匹配,如本領(lǐng)域技術(shù)人員所理解的。因此,兩個序列如果他們能夠相互雜交而形成穩(wěn)定的反平行的、雙鏈核酸結(jié)構(gòu),則他們相互“互補”。如果第一多核苷酸的核苷酸序列與第二多核苷酸的多核苷酸結(jié)合伴侶的核苷酸序列完全相同,或者第一多核苷酸能夠在嚴(yán)格雜交條件下與第二多核苷酸雜交,則該第一多核苷酸與第二多核苷酸互補。因此,序列為5’-TATAC_3’的多核苷酸與序列為5,-GTATA-3,的多核苷酸互補。“引物”是指這樣的多核苷酸序列,它能夠特異性地雜交多核苷酸模板序列,例如, 引物結(jié)合片段,并能夠在適合的合成條件下提供合成互補多核苷酸的起始點,即,在核苷酸和能夠催化合成反應(yīng)的試劑(例如DNA聚合酶)存在的條件下。引物與多核苷酸模板序列互補,但是不需要與多核苷酸模板序列精確互補。例如,引物可以與多核苷酸模板序列的互補物具有至少80,85,90,95,96,97,98,或99%的相同。引物可以具有可變的長度但是通常至少15個堿基。在一些實施方式里,引物在15和35個堿基長度之間。在一些實施方式里, 引物為大于35個堿基長度。在其它實施方式里,引物具有解鏈溫度(Tm)至少50°C,所述解鏈溫度是指在該溫度下DNA雙鏈體的一半將分離形成單鏈。在其它實施方式里,引物具有 50°C和70°C之間的Tm。在另外的實施方式里,引物不形成明顯的DNA或RNA 二級結(jié)構(gòu),從而不影響與多核苷酸模板序列的雜交效率。如本文所述,術(shù)語“引物結(jié)合片段”是這樣的多核苷酸序列,它與引物結(jié)合以提供在適合合成的條件下合成互補多核苷酸的起始點。在一些實施方式里,引物結(jié)合序列是本發(fā)明的可退火接頭之一。在已知的裝配組合物之內(nèi)的裝配載體或組分多核苷酸之中,當(dāng)不存在互補接頭時,序列成為引物結(jié)合序列而不是可退火接頭。在一些實施方式里,引物結(jié)合片段作為基因組靶向序列起作用,例如,上游或下游基因靶向序列。如本文所述,術(shù)語“接頭序列”和“可退火接頭序列”可交替地使用,指包含在本文所述的輸入載體和裝配載體之內(nèi)的多核苷酸序列。特別是,可退火接頭序列在輸入載體或裝配載體之內(nèi)側(cè)鄰于DNA片段。在從裝配載體切除組分多核苷酸和變性該組分多核苷酸之后,可退火接頭能夠在多核苷酸裝配反應(yīng)中特異性雜交相鄰組分多核苷酸的互補可退火接頭序列,如本文所述??赏嘶鸾宇^序列,在與互補接頭鏈退火后,能提供合成互補多核苷酸的起始點。如本文所述,術(shù)語“載體”在參考文獻(xiàn)中用于指細(xì)胞內(nèi)能夠復(fù)制的染色體外的核酸分子,插入序列能夠可操作地連接載體以使插入序列復(fù)制。有用的實例包括但不限于環(huán)形 DNA分子例如質(zhì)粒構(gòu)建體,噬菌體構(gòu)建體,黏粒載體,等等,以及線形核酸構(gòu)建體(例如,λ 噬菌體構(gòu)建體,細(xì)菌人工染色體(BAC),酵母人工染色體(YAC),等等)。載體可以包括表達(dá)信號例如啟動子和/或終止子,選擇性標(biāo)記例如賦予抗生素抗性的基因,和一個或多個限制性酶切位點,插入序列可以克隆進(jìn)入其中。載體可以具有其它獨特的特性(例如其能夠適應(yīng)的DNA插入片段的大小)。如本文所述,術(shù)語“輸入載體”是指這樣的克隆載體質(zhì)粒,它能夠在用于本發(fā)明提供的多核苷酸裝配方法的裝配載體的制備中作為親本載體。輸入載體包含兩個可退火接頭序列,或一個可退火接頭序列和一個引物結(jié)合片段,其側(cè)鄰于限制性酶切位點,所述位點可用于引入DNA片段以形成裝配載體。如本文所述,“裝配載體”是指已經(jīng)引入DNA片段的輸入載體。裝配載體在本文描述的多核苷酸裝配方法中用來提供組分多核苷酸,以裝配進(jìn)入裝配好的多核苷酸。如本文所述,術(shù)語“裝配載體”指這樣的載體,其包含一個可退火接頭序列,兩個可退火接頭序列,或一個可退火接頭序列和一個引物結(jié)合片段,以及一個DNA片段。如本文所述,術(shù)語“限制性酶”或“限制性內(nèi)切酶”是指這樣一類催化分子的成員,其結(jié)合同一類DNA序列并在該序列中的一個精確位置切斷該DNA分子。限制性內(nèi)切酶包括 IIS型限制性內(nèi)切酶。這種酶與其它限制性內(nèi)切酶的不同之處在于其識別序列與切斷序列相分離。IIS 型限制性酶的一些實例包括 AlwI,BsaI,BbsI,BbuI,BsmAI,BsrI,BsmI,BspMI, Earl, Esp3I, FokI,HgaI,HphI,LguI,MboII,MnlI, PleI,SapI,SchI,SfaNi,等等。很多這些限制性內(nèi)切酶可以商業(yè)上獲得并為本領(lǐng)域技術(shù)人員所熟知。如本文所述,術(shù)語“可退火接頭序列雙鏈體”是指一個可退火接頭序列鏈與充分互補的可退火接頭序列鏈以反平行連接方式聯(lián)合?;パa不需要完美;可退火接頭序列雙鏈體可以包含錯配堿基對或不配對堿基,盡管在特別的實施方式里,可退火接頭序列雙鏈體包含兩個具有完美互補性的可退火接頭序列鏈。如本文所述,術(shù)語“基因組靶向序列”是指在宿主細(xì)胞的基因組上一定位置的核酸序列,在該位置本發(fā)明的多核苷酸通過宿主細(xì)胞介導(dǎo)的同源重組而插入其中。術(shù)語“上游基因組靶向序列”和“下游基因組靶向序列”是指在宿主細(xì)胞基因組中相對位于上游和下游的基因組靶向序列。如本文所述,術(shù)語“染色體靶向序列”是指宿主細(xì)胞的染色體上一定位置的核酸序列,在該位置本發(fā)明的多核苷酸通過宿主細(xì)胞介導(dǎo)的同源重組而插入其中。術(shù)語“上游染色體靶向序列”和“下游染色體靶向序列”是指在宿主細(xì)胞染色體中相對位于上游和下游的染色體靶向序列。5. 2多核苷酸裝配方法在一方面,本發(fā)明提供了將多種組分多核苷酸有序裝配為一種或多種裝配好的多核苷酸的快速、牢固和高通量的方法。本發(fā)明的方法使用環(huán)形核酸載體,稱為裝配載體,其分別包含DNA片段D,側(cè)鄰于可退火接頭序列(即,LA或LB),一對可退火接頭序列(即,LA 和LB),或可退火接頭序列和引物結(jié)合片段(即,LA和PB或者LB和PA),和一對限制性酶切位點,RA和RB (圖1B)。限制性內(nèi)切酶在限制性酶切位點RA和RB消化多種裝配載體產(chǎn)生了多種組分多核苷酸,所述組分多核苷酸包含元件5’-LA-D-3’,5’-D-LB-3’,5’-LA-D-LB-3’, 5’ -LA-D-PB-3’,或5’ -LB-D-PA-3,(圖3)。在本發(fā)明的方法里,可退火接頭序列LA和LB 提供具有互補末端的組分多核苷酸,以用于結(jié)合重疊延伸裝配反應(yīng),繼之以聚合酶鏈?zhǔn)椒磻?yīng)(S0E/PCR)以使組分多核苷酸以有序順序裝配進(jìn)入裝配好的多核苷酸。特別是,所述方法能用于將多個功能性DNA元件裝配進(jìn)入單一的裝配好的多核苷酸,所述功能性DNA元件包括但不限于蛋白質(zhì)編碼序列,報告基因,熒光標(biāo)記編碼基因,啟動子,增強子,終止子,內(nèi)含子,外顯子,聚-A尾,多克隆位點,核定位信號,mRNA定位信號, 選擇性標(biāo)記,整合位點,表位標(biāo)簽編碼序列,和降解信號。該方法可用于裝配任何類型的裝配好的多核苷酸,包括但不限于合成基因,構(gòu)建體,克隆載體,表達(dá)載體,染色體,基因組整合構(gòu)建體,基因組,和DNA文庫。進(jìn)一步,所述方法可用于在單一反應(yīng)中裝配DNA片段,而不需要處理和表征中間產(chǎn)物。在一些實施方式里,所述方法也可用于將多種組分多核苷酸裝配為裝配好的多核苷酸,其中所述組分多核苷酸不是來源于裝配載體(即,通過本領(lǐng)域公知的標(biāo)準(zhǔn)過程獲得的DNA片段,例如PCR擴增,化學(xué)合成,等等,其側(cè)鄰于一或兩個可退火接頭序列,LA和/或 LB,或可退火接頭序列和引物結(jié)合片段(S卩,LA和PB或者LB和PA))。不來源于裝配載體的組分多核苷酸可以在S0E/PCR反應(yīng)或者宿主細(xì)胞介導(dǎo)的同源重組之前的任何步驟中加入裝配反應(yīng),以裝配進(jìn)入裝配好的多核苷酸。因此,在一些實施方式里,該裝配方法可以用于裝配(1)組分多核苷酸,其來自裝配載體,該裝配載體包含一個或兩個可退火接頭序列,或一個可退火接頭序列和一個引物結(jié)合片段,通過消化所述裝配載體而產(chǎn)生組分多核苷酸;( 非載體DNA片段,側(cè)鄰于一個或兩個可退火接頭序列,或一個可退火接頭序列和一個引物結(jié)合片段,和( 其組合。在一些實施方式里,本發(fā)明提供將多種組分多核苷酸裝配進(jìn)入一種或多種裝配好的多核苷酸的方法,包含如下步驟(a)用一種或多種限制性內(nèi)切酶消化裝配組合物以產(chǎn)生組分組合物,所述裝配組合物包含(i) 一個或多個第一核酸分子,其中每個第一核酸分子是環(huán)形的并以5’至3’方向包含第一限制性酶切位點RAtl,選自組PA的任意引物結(jié)合片段,選自組Dtl的任意DNA片段,可退火接頭序列LBtl,和第二限制性酶切位點RBtl ;(ii) 一個或多個中間核酸分子,其中每個中間核酸分子η是環(huán)形的并以5’至3’ 的方向包含第一限制性酶切位點RAn,第一可退火接頭序列LAn,選自組Dn的任意DNA片段,第二可退火接頭序列LBn,和第二限制性酶切位點RBn,其中η表示從1到中間核酸分子數(shù)目的整數(shù);和(iii) 一個或多個最后核酸分子,其中每個最后核酸分子是環(huán)形的并以5’至3’的方向包含第一限制性酶切位點RAm,第一可退火接頭序列LAm,選自組Dm的任意DNA片段, 選自組PB的任意引物結(jié)合片段,第二限制性酶切位點RBm,其中m表示比中間核酸分子數(shù)目大1的整數(shù);其中切斷RAtl至RBm的限制性酶切位點,變性所獲得的線形核酸分子之后,每個可退火接頭序列LB(p_d能夠與可退火接頭序列LAp的互補物雜交,其中η是在1到(m-1) 范圍內(nèi)的整數(shù),其中P表示一個從1到m的整數(shù),并且其中每個組Dtl,. . . Dn,. . . Dffl由一個或多個DNA片段組成;其中所述一種或多種限制性內(nèi)切酶能夠切斷RAtl至RBm的限制性酶切位點;和(b)使組分組合物接觸DNA聚合酶,三磷酸脫氧核糖核苷和一個或多個第一引物和一個或多個第二引物,在適合核酸分子變性的條件下,退火可退火接頭序列LB(p_d至可退火接頭序列LAp,并從此延伸;其中每個所述第一引物能夠與選自組PA的所述引物結(jié)合片段之一雜交,而每個第二引物能夠與選自組PB的所述引物結(jié)合片段之一雜交;并且將所述組分組合物進(jìn)行聚合酶鏈?zhǔn)椒磻?yīng),其中以5’到3’方向包含分別選自組Dtl,...Dn,...和Dm的一個DNA片段的多核苷酸被裝配起來。在所述方法里,P表示從1到m的整數(shù)。圖3為示意性性目的描述了本發(fā)明的裝配方法的一個實施方式。在該實例里,總共四種組分多核苷酸裝配產(chǎn)生了裝配好的多核苷酸。但是,本發(fā)明提供的裝配方法可以用于將任意數(shù)量的組分多核苷酸裝配進(jìn)入一種或多種裝配好的多核苷酸。在一些實施方式里,本發(fā)明提供的方法導(dǎo)致2,3,4,5,6,7,8,9,10,11,12,13,14,15,或更多組分多核苷酸被裝配進(jìn)入一種或多種裝配好的多核苷酸。在圖3示意的實例里,裝配組合物包含四個輸入裝配載體,表示為“第一”,“中間 1 Gnt1) ”,“中間2(int2)”,和“最后”,裝配好的多核苷酸由所述裝配組合物產(chǎn)生。每個裝配載體分別包含DNA片段側(cè)鄰于一個可退火接頭序列和一個引物結(jié)合片段,或者兩個可退火接頭序列。特別地,DNA片段Dtl側(cè)鄰于5’引物結(jié)合片段PA和3’可退火接頭序列LBcit5 DNA 片段Dl側(cè)鄰于5’和3’可退火接頭序列LA1和LB1,而DNA片段D2側(cè)鄰于5’和3’可退火接頭序列LA2和LB2。DNA片段D3側(cè)鄰于3’引物結(jié)合片段PB和5’可退火接頭序列LA3。裝配載體中的元件 5’ -PA-D-LB-3’,5’ -LA-D-LB-3’,或 5’ -LA-D-PB-3’ 進(jìn)一步側(cè)鄰于 SapI 限制性酶切位點。在圖3展示的裝配反應(yīng)的第一步,裝配組合物被用SapI消化,導(dǎo)致組分多核苷酸被從裝配載體骨架中切除出來而成為組分組合物,所述組分多核苷酸包含元件 5’ -PA-D-LB-3’,5’ LA-D-LB-3’,或 5’ -LA-D-PB-3’。由于 SapI 是 IIS 型限制性內(nèi)切酶,其識別位點在其切斷位點的遠(yuǎn)端,而其切斷發(fā)生在其識別序列之外。這一性質(zhì)使IIS型限制性內(nèi)切酶尤其適用于根據(jù)本發(fā)明提供的方法來裝配多核苷酸,因為不包含限制性酶切位點傷痕的多核苷酸可以被裝配起來,這是不同于用非IIS型限制性內(nèi)切酶切斷限制性酶切位點RA和RB的結(jié)果。參考圖2,RA0, RAnJn RAm的IIS型識別位點分別在其對應(yīng)切斷位點的 5’端,而RBtl, 1,和RAm的IIS型識別位點分別在其對應(yīng)切斷位點的3’端。因此,限制性酶切位點RAtl到I m是定向的從而其被一種或多種能夠切斷RAtl到RBm的IIS型限制性內(nèi)切酶所切斷,導(dǎo)致了 RAtl從Dtl分離,LBtl從RBtl分離,RAn從LAn分離,LBn從RBn分離,RAm從LAm 分離,和Dm從RBm分離,結(jié)果產(chǎn)生的線形核酸分子包含Dtl,LB0, RAn, LBn, LAm或Dm而不包含 RA0到RBm的任何一個。從而,獲得的組分多核苷酸不包括限制性內(nèi)切酶的識別或切斷位點的任何痕跡。因此本發(fā)明的裝配多核苷酸的方法可以用于多次轉(zhuǎn)化宿主細(xì)胞而不引入重復(fù)序列,后者可能導(dǎo)致遺傳不穩(wěn)定性。隨后,限制性內(nèi)切酶可選地失活。如果需要失活,本領(lǐng)域公知的失活核酸內(nèi)切酶活性的任何方法都可以使用,包括基于柱或凝膠的純化方法。一種方便的方法是加熱失活,例如,65°C 20分鐘,僅需要很少或不需要在反應(yīng)試管外操作所述組分組合物。組分多核苷酸之間的互補末端的重疊鏈形成的序列雙鏈體啟動了組分多核苷酸裝配進(jìn)入裝配好的多核苷酸。特別是,可退火接頭序列設(shè)計為可退火接頭序列LBtl能雜交可退火接頭序列LA1的互補物,可退火接頭序列LB1能雜交可退火接頭序列LA2的互補物, 而可退火接頭序列LB2能雜交可退火接頭序列LA3的互補物。從而,在裝配反應(yīng)的第二步, 組分多核苷酸用于變性條件(例如,加熱)以產(chǎn)生單鏈組分多核苷酸,并且伴隨著或者在裝配反應(yīng)的變性步驟之后接觸耐熱DNA聚合酶和三磷酸脫氧核糖核苷。耐熱DNA聚合酶可以是本領(lǐng)域技術(shù)人員認(rèn)為合適的任何耐熱DNA聚合酶。適合用于本方法的耐熱DNA聚合酶包括但不限于Thermus thermophilus (Tth) DNA聚合 Si, Thermus aquaticus (Taq) DNA 聚合 Thermotoga neopolitana (Tne)DNA 聚合 Thermotoga maritima(Tma)DNA聚合酶,Therm°C°C cus lit和alis(Tli或VENTTM)DNA聚合酶,Pyr°C "C cus furiosus (Pfu 或 DEEPVENT ) DNA 聚合酶,Pyr°C "C cus woosii (Pwo) DNA 聚合酶,Bacillus sterothermophilus (Bst) DNA 聚合酶,Sulfolobus acid°C aldarius (SAC) DNA 聚合酶,Thermoplasma acidophilum(Tac)DNA 聚合酶,Thermus f lavus (Tf 1/Tub) DNA 聚合酶,Thermus ruber (Tru) DNA 聚合酶,Thermus br°C kianus (DYNAZYME ) DNA 聚合酶, Methanobacterium thermoautotrophicum(Mth) DNA 聚合酶,及其突變物,變體,禾口其衍生物。優(yōu)選具有高保真性(即,校對機制)和低錯配率的耐熱DNA聚合酶。在某些實施方式里,DNA 聚合酶是 Phusion DNA 聚合酶(New Engl 和 Biolabs,Ipswich, ΜΑ)。在其它實施方式里,DNA聚合酶是PfuUltra II Fusion DNA聚合酶(Strategene/Agilent,La Jolla, CA)。然后將裝配反應(yīng)置于允許從重疊可退火接頭序列的3’羥基部分開始鏈延伸的條件下,期間耐熱DNA聚合酶填充重疊的可退火接頭序列之間的部分。裝配反應(yīng)經(jīng)受一定數(shù)量的變性/退火/延伸的重復(fù)循環(huán)(例如,5-15個循環(huán)),期間形成了足量的雙鏈的裝配好的多核苷酸。在該循環(huán)期間,組分多核苷酸即作為引物也作為模板以產(chǎn)生裝配好的多核苷酸的全長模板。在某些實施方式里,PCR的所述退火和延伸步驟都在72°C下進(jìn)行。與可退火接頭序列LA和LB相比,引物結(jié)合片段PA和PB設(shè)計為相互之間或者與任何可退火接頭序列或DNA片段之間都不重疊,但是作為用于擴增全長的裝配好的多核苷酸的引物的結(jié)合位點。因此,在裝配反應(yīng)的4和5,加入與引物結(jié)合片段PA和PB互補的引物,該組合物置于傳統(tǒng)PCR擴增條件下。PCR擴增條件可以是本領(lǐng)域技術(shù)人員認(rèn)為合適的任何PCR擴增條件,包括如《PCR Technology principles和Applications f 和 DNA Amplification)), ed. HA Erlich, Stockton Press, New Y 和 k,N. Y. (1989);《PCR Prot °C ols :A Guide to methods 禾口 Applications》,eds. Innis, Gelfl 禾口,Snisky,禾口 White, Academic Press, San Diego, Calif(1990) ;Mattila et al. (1991)Nucleic Acids Res. 19 :4967 ;Eckert, K. Α.和 Kunke 1, Τ. A. (1991)PCR Methods 和 Applications 1 17 ; 和U. S.專利號4,683,202和4,965,188中所描述的,它們分別引入本文作為參考。在某些實施方式里,裝配反應(yīng)的PCR步驟包含大約35個循環(huán)的變性,退火和延伸,在與引物結(jié)合片段PA和PB互補的引物存在的條件下。在某些實施方式里,PCR的退火和延伸步驟可以都在72°C下進(jìn)行。但是,本領(lǐng)域技術(shù)人員將明白成功擴增的最佳條件依賴于所用的耐熱DNA 聚合酶和可退火接頭序列,這些條件從而可以調(diào)整。任選地,裝配好的多核苷酸可以通過本領(lǐng)域技術(shù)人員抑制的任何技術(shù)來純化,例如,凝膠電泳純化方法,然后用于各種目的。例如,裝配好的多核苷酸可以插入表達(dá)載體骨架以進(jìn)行序列驗證。5. 3制備包含裝配好的多核苷酸的宿主細(xì)胞的方法在另一方面,本發(fā)明提供制備包含裝配好的多核苷酸的宿主細(xì)胞的方法。在一些實施方式里,裝配好的多核苷酸是至少31Λ大小。在其它實施方式里,裝配好的多核苷酸是至少51Λ大小。在其它實施方式里,裝配好的多核苷酸是至少6,7,8,9或101Λ大小。在其它實施方式里,裝配好的多核苷酸為大于101Λ大小。在其它實施方式里,裝配好的多核苷酸為大于151Λ大小。在其它實施方式里,裝配好的多核苷酸為大于201Λ大小。在一些實施方式里,提供的方法包含用由本文描述的多核苷酸裝配方法產(chǎn)生的裝配好的多核苷酸轉(zhuǎn)化宿主細(xì)胞。裝配好的多核苷酸可以再轉(zhuǎn)化之前環(huán)形化,也可以以線形分子轉(zhuǎn)化。裝配好的多核苷酸可以在宿主細(xì)胞內(nèi)以染色體外多核苷酸來維持。可選地,裝配好的多核苷酸可以整合進(jìn)入宿主細(xì)胞的基因組,例如,通過宿主細(xì)胞介導(dǎo)的同源重組。為了通過同源重組將裝配好的多核苷酸整合進(jìn)入基因組,裝配好的多核苷酸必須在一個末端包含具有上游基因組靶向序列的核酸序列,而在另一個末端包含具有下游基因組靶向序列的核酸序列。從而,要整合進(jìn)入宿主細(xì)胞染色體的裝配好的多核苷酸是從這樣的裝配組合物產(chǎn)生的,所述裝配組合物包含包括上游染色體整合序列的第一核酸分子和包括下游染色體整合序列的最后核酸分子,每個染色體靶向序列都足夠長度以起始宿主細(xì)胞介導(dǎo)的它與染色體之間的同源重組。在其它實施方式里,所述方法包含用由本文描述的多核苷酸裝配方法產(chǎn)生的大量裝配好的多核苷酸轉(zhuǎn)化宿主細(xì)胞。在一個特別的實施方式里,宿主細(xì)胞通過同源重組將兩個或更多裝配好的多核苷酸組合進(jìn)入單一的組合多核苷酸。包含組合多核苷酸的宿主細(xì)胞轉(zhuǎn)化體由于表達(dá)選擇性標(biāo)記而被篩選出來,所述選擇性標(biāo)記在組合裝配好的多核苷酸的過程中產(chǎn)生。所述方法對通過同源重組將相對大的多核苷酸片段插入目標(biāo)多核苷酸尤其有用。為了發(fā)生染色體整合,組合多核苷酸必須分別包含上游基因組靶向序列位于選擇性標(biāo)記的編碼序列的5’或3’位置,和下游基因組靶向序列位于選擇性標(biāo)記的編碼序列的3’或 5’位置。本文所用的基因組整合包括染色體整合,即,多核苷酸整合進(jìn)入宿主細(xì)胞的染色體。Saccharomyces cerevisiae中合適的染色體整合位點包括但不限于NDT80,H0,GAL2, 和GAL1-GAL10-GAL7位點。該方法也可以用于產(chǎn)生包含染色體外維持的多核苷酸的宿主細(xì)胞,例如,質(zhì)粒和表達(dá)載體。當(dāng)組合多核苷酸不包含相同的可退火接頭序列或DNA片段排列為正向重復(fù)的時候,染色體整合的和染色體外保持的組合多核苷酸的穩(wěn)定性都會增加,否則這種正向重復(fù)會起始額外的同源重組事件并導(dǎo)致組分多核苷酸片段的切除。因此,在一些實施方式里,裝配好的多核苷酸包含獨特的可退火接頭序列和DNA片段。在其它實施方式里,裝配好的多核苷酸包含一個或多個同樣的可退火接頭序列或DNA片段,但它們在裝配好的多核苷酸組合之后在組合多核苷酸中以反向重復(fù)來排列。圖8示意了示例性的組合多核苷酸的制備和通過同源重組將組合的多核苷酸整合進(jìn)入宿主細(xì)胞的染色體中。能夠同源重組的宿主細(xì)胞吸收了兩種裝配好的多核苷酸A和 B。每種裝配好的多核苷酸分別包含DNA片段Dm,其編碼選擇性標(biāo)記的一個片段,其中裝配好的多核苷酸A的DNA片段Dml編碼選擇性標(biāo)記的第一片段,而裝配好的多核苷酸B的DNA 片段Dm2編碼選擇性標(biāo)記的第二片段,其中DNA片段Dml和DNA片段Dm2包含足夠起始宿主細(xì)胞介導(dǎo)的同源重組的同源區(qū)域,并且其中DNA片段Dml和DNA片段Dm2均不能產(chǎn)生功能性選擇性標(biāo)記,但是通過宿主細(xì)胞介導(dǎo)的同源重組,產(chǎn)生了功能性的選擇性標(biāo)記。每種裝配好的多核苷酸分別進(jìn)一步包含DNA片段隊。其編碼染色體靶向序列并具有足夠長度以起始宿主細(xì)胞介導(dǎo)的同源重組,其中裝配好的多核苷酸A的DNA片段Dtll編碼上游染色體靶向序列, 而裝配好的多核苷酸B的DNA片段Dtl2編碼下游染色體靶向序列。一旦進(jìn)入細(xì)胞,宿主細(xì)胞將在DNA片段Dml和Dm2的同源區(qū)域組合裝配好的多核苷酸A和裝配好的多核苷酸B,以形成組合的多核苷酸。此外,宿主細(xì)胞使用DNA片段Dtll和Dtl2編碼的染色體靶向序列而使組合的多核苷酸通過同源重組插入其染色體。包含組合的多核苷酸的宿主細(xì)胞很容易基于其產(chǎn)生的功能性選擇性標(biāo)記而鑒別出來。在其它實施方式里,所述方法包含用多種組分多核苷酸轉(zhuǎn)化宿主細(xì)胞,并允許宿主細(xì)胞通過同源重組產(chǎn)生一種或多種裝配好的多核苷酸。裝配好的多核苷酸可以在宿主細(xì)胞內(nèi)染色體外保持或者整合進(jìn)入宿主細(xì)胞的染色體。圖9示意了通過宿主細(xì)胞中同源重組而產(chǎn)生示例性的裝配好的多核苷酸和將裝配好的多核苷酸整合進(jìn)入宿主細(xì)胞染色體。第一步,包含裝配載體的裝配組合物用IIS型限制性例如SapI或LguI內(nèi)切酶消化導(dǎo)致組分多核苷酸從裝配載體骨架中切除出來。在該實施方式里,Dtl和D3可以是上游或下游染色體靶向序列,這種情況下第一裝配載體和最后裝配載體中具有引物結(jié)合片段是可選的。或者,這兩個引物結(jié)合片段能夠作為上游和下游基因組靶向序列起作用。
一旦切除出來,每個切除的組分多核苷酸分別包含可退火接頭序列LB,其同源于另一種組分多核苷酸的可退火接頭序列LA,并具有足夠長度以起始宿主細(xì)胞介導(dǎo)的同源重組。從第一裝配載體切下的組分多核苷酸進(jìn)一步包含上游染色體靶向序列,而從最后裝配載體切下的組分多核苷酸進(jìn)一步包含下游染色體靶向序列,其中兩個染色體靶向序列都具有足夠長度以在宿主細(xì)胞中起始宿主細(xì)胞介導(dǎo)的與染色體之間的同源重組。限制性內(nèi)切酶隨后被失活。在所述方法的第二步,組分組合物被引入能夠同源重組的宿主細(xì)胞。一旦進(jìn)入細(xì)胞,宿主細(xì)胞在可退火接頭序列之間的同源區(qū)域組合所述組分多核苷酸以形成裝配好的多核苷酸,而裝配好的多核苷酸整合進(jìn)入染色體。包含裝配好的多核苷酸的宿主細(xì)胞可以通過基于裝配好的多核苷酸的DNA片段編碼的選擇性標(biāo)記而容易地鑒別出來。任何宿主細(xì)胞可以用于本文描述的方法。在特定的實施方式里,合適的宿主細(xì)胞是能夠基于序列互補性而組合多核苷酸的宿主細(xì)胞,所述序列互補性例如本發(fā)明提供的選擇性標(biāo)記片段,基因組靶向序列,和可退火接頭序列。這種宿主細(xì)胞的示意性實例包括但不限于&iccharomyces Cerevisiae0適合這些宿主細(xì)胞攝入DNA的條件是本領(lǐng)域熟知的。包含裝配好的多核苷酸或組合多核苷酸的宿主細(xì)胞轉(zhuǎn)化體可以由于裝配好的多核苷酸或者組合多核苷酸編碼的選擇性標(biāo)記的表達(dá)而被容易地鑒別出來,所述選擇性標(biāo)記允許通過促進(jìn)或者抑制細(xì)胞的生長來選擇。選擇性標(biāo)記可以由裝配組合物的裝配載體中出現(xiàn)的單獨DNA片段來編碼??蛇x地,選擇性標(biāo)記的非功能性片段可以由裝配組合物的多種裝配載體中或者多種裝配好的多核苷酸中出現(xiàn)的DNA片段來編碼,而功能性選擇性標(biāo)記僅分別由裝配好的多核苷酸或者組合多核苷酸產(chǎn)生。本領(lǐng)域已知多種選擇性標(biāo)記(例如參見Kaufinan,Meth. Enzymol.,185 487(1990) ;Kaufman,Meth. Enzymol. , 185 :537(1990) ;Srivastava 禾口 Schlessinger, Gene, 103:53(1991) ;Romanos et al. , in DNA Cloning 2 :Expression Systems, 2nd Edition, pages 123-167(IRL Press 1995) ;Markie,MethodsMol. Biol. ,54 :359(1996) ;Pfeifer et al.,Gene,188 :183(1997) ;Tucker 禾口Burke,Gene,199 :25 (1997) ;Hashida-Okado et al., FEBS Letters,425 :117(1998)) 0在一些實施方式里,選擇性標(biāo)記是藥物抗性標(biāo)記。藥物抗性標(biāo)記使細(xì)胞能夠?qū)σ环N外源藥物解毒,否則該藥物將殺死細(xì)胞。藥物抗性標(biāo)記的示意性實例包括但不限于賦予對抗生素的抗性,例如氨芐青霉素,四環(huán)素,卡那霉素,博萊霉素, 鏈霉素,潮霉素,新霉素,kocin ,等等。在其它實施方式里,選擇性標(biāo)記是營養(yǎng)缺陷型標(biāo)記。營養(yǎng)缺陷型標(biāo)記允許細(xì)胞在缺乏某種必要組分的培養(yǎng)基里生長的時候能夠合成必要組分(通常是氨基酸)。選擇性營養(yǎng)缺陷型基因序列包括,例如,hisD,其允許在組氨醇存在的情況下在組氨酸缺乏的培養(yǎng)基里生長。其它選擇性標(biāo)記包括博萊霉素抗性基因,金屬硫蛋白基因,潮霉素B-磷酸轉(zhuǎn)移酶基因,AURI基因,腺苷脫氨基酶基因,氨基糖苷磷酸轉(zhuǎn)移酶基因,二氫葉酸還原酶基因,胸苷激酶基因,黃嘌呤-烏嘌呤磷酸核糖轉(zhuǎn)移酶基因,等等。營養(yǎng)缺陷型也可以用于鑒別包含染色體整合的裝配好的多核苷酸或組合多核苷酸的宿主細(xì)胞轉(zhuǎn)化株,當(dāng)裝配好的多核苷酸或組合多核苷酸的整合導(dǎo)致中斷了宿主細(xì)胞需要用來合成細(xì)胞生長所必須的組分的基因的時候,使細(xì)胞成為營養(yǎng)缺陷突變體。包含染色體整合的裝配好的多核苷酸或組合多核苷酸的宿主細(xì)胞轉(zhuǎn)化株也可以通過篩選具有其它特性的宿主細(xì)胞轉(zhuǎn)化株而鑒別出來,所述特性由單獨DNA片段或者組合 DNA片段編碼,例如,表達(dá)發(fā)光的肽,或宿主細(xì)胞單克隆的分子分析,例如,通過限制性酶圖
31譜,PCR擴增,或者分離裝配好的多核苷酸或染色體整合為點的序列分析。5. 4多核苷酸裝配的組合方法和宿主細(xì)胞的制備在另一方面,本發(fā)明提供將多種組分多核苷酸有序裝配進(jìn)入多種裝配好的多核苷酸的快速,牢固,和高通量的方法。該方法依賴于使用包含裝配載體的裝配組合物,其中所述裝配載體分別包含DNA片段D,側(cè)鄰于可退火接頭序列LA或LB,一對可退火接頭序列LA 和LB,或者一個可退火接頭序列和一個引物結(jié)合片段,即,LA和PB或者LB和PA,側(cè)鄰于一對限制性酶切位點RA和RB(圖1B)。但是,為了用本發(fā)明公開的方法產(chǎn)生多樣的裝配好的多核苷酸,選擇可退火接頭序列和引物結(jié)合片段以使得多于一種的組分多核苷酸的組合能在反應(yīng)中被裝配進(jìn)入裝配好的多核苷酸。因此,在某些實施方式里,裝配組合物包含至少兩種裝配載體,其具有相同可退火接頭序列LA或LB或者相同引物結(jié)合片段PA或PB,但是至于DNA片段則不相同。在其它實施方式,裝配組合物包含至少兩種裝配載體,其具有同樣的可退火接頭序列對LA和LB,或者同樣的可退火接頭序列可退火接頭序列和引物結(jié)合片段對,即,LA和PB或者LB和PA,至于DNA片段則不相同。圖10描述了在同一個反應(yīng)中由七種(7)組分多核苷酸產(chǎn)生多種裝配好的多核苷酸的示例性方法。包含要裝配的DNA片段的裝配載體注入一個單一的試管,用SapI消化以從裝配載體骨架中釋放組分多核苷酸片段。加熱失活SapI之后,組分多核苷酸經(jīng)歷變性條件,繼之以退火條件使足夠互補的可退火接頭序列對雜交。隨后在DNA聚合酶和dNTP存在下引物延伸,加入與引物結(jié)合片段PA和PB互補的引物,以PCR擴增八種(8)不同的全長的裝配好的多核苷酸,包括在各種可能的組合下裝配的DNA片段Dciiai2,D172, D3,和D41/42。單獨的裝配好的多核苷酸可以從混合的裝配好的多核苷酸的組合物中分離出來,例如,通過另個輪PCR擴增并使用與DNA片段Dtll,D02, D41,和D42的區(qū)域互補的引物??蛇x地,可以使用包含一組引物結(jié)合片段PA和/或PB的第一裝配載體和最后裝配載體并使用僅雜交選擇的引物結(jié)合片段PA和PB的亞組的引物,通過PCR擴增而使一系列裝配好的多核苷酸分離出來。分離的裝配好的多核苷酸可以用于,例如,轉(zhuǎn)化宿主細(xì)胞以產(chǎn)生包含裝配好的多核苷酸的多種宿主細(xì)胞。可選擇地,宿主細(xì)胞可以用混合的裝配好的多核苷酸的組合物直接轉(zhuǎn)化,而包含每種裝配好的多核苷酸的宿主細(xì)胞轉(zhuǎn)化株可以被分離出來,例如,通過宿主細(xì)胞單克隆的分子分析,或者通過選擇包含選擇性標(biāo)記的宿主細(xì)胞轉(zhuǎn)化株,或者展現(xiàn)由單獨DNA 片段或DNA片段組合編碼的其它特性的細(xì)胞轉(zhuǎn)化株。在其它實施方式里,包含多種通過組合方法裝配的多核苷酸的多種宿主細(xì)胞通過如下方法產(chǎn)生用包含多種裝配好的多核苷酸的組合物轉(zhuǎn)化宿主細(xì)胞,其中至少兩種裝配好的多核苷酸包含選擇性標(biāo)記的非功能性片段,在此基礎(chǔ)上同源重組能產(chǎn)生功能性選擇性標(biāo)記,然后篩選包含組合的多核苷酸的宿主細(xì)胞。圖11示意了產(chǎn)生多種包含組合的多核苷酸的宿主細(xì)胞的組合性嘗試。在該實例里,裝配好的多核苷酸Al和A2,分別包含相同的上游染色體靶向序列和相同的選擇性標(biāo)記的第一部分,而裝配好的多核苷酸Bl和B2,分別包含相同的下游染色體靶向序列和相同的選擇性標(biāo)記的第二部分,被通過宿主細(xì)胞介導(dǎo)的同源重組組合性組合起來,以產(chǎn)生四種不同的組合多核苷酸,Al/Bl, A1/B2, A2/B1,和A2/B2, 它們可以被插入染色體以產(chǎn)生四種不同的宿主細(xì)胞。在另外的其它實施方式里,包含通過組合方法裝配和組合的多種多核苷酸的多種宿主細(xì)胞由以下方法產(chǎn)生用包含多種組分多核苷酸的組分組合物轉(zhuǎn)化宿主細(xì)胞,其中至少兩種組分多核苷酸包含選擇性標(biāo)記的非功能性片段,在此基礎(chǔ)上同源重組能產(chǎn)生功能性選擇性標(biāo)記,然后篩選包含組合多核苷酸的宿主細(xì)胞。5. 5輸入載體在另一方面,本發(fā)明提供了載體,S卩,輸入載體,它可以用于制備裝配載體。在一些實施方式里,輸入載體是環(huán)形多核苷酸并包含選擇性標(biāo)記,復(fù)制起始位點,和中間的DNA片段,它側(cè)鄰兩個限制性酶切位點,后者有利于在本發(fā)明提供的方法中亞克隆用于裝配的不同的DNA片段。輸入載體進(jìn)一步包含一個或兩個可退火接頭序列,或者一個可退火接頭序列和一個引物結(jié)合片段,側(cè)鄰于限制性酶切位點。輸入載體進(jìn)一步包含額外的一對限制性酶切位點位于DNA片段的外側(cè),例如,在所述一個或兩個可退火接頭序列或者所述可退火接頭序列和引物結(jié)合片段的外側(cè)。從而,在一些實施方式里,輸入載體是環(huán)形多核苷酸并以 5’至3’方向包含限制性酶切位點RA,可退火接頭序列LA,限制性酶切位點RY,DNA片段 D,限制性酶切位點RZ,和限制性酶切位點RB。在其它實施方式里,輸入載體是環(huán)形多核苷酸并以5’至3’方向包含限制性酶切位點RA,限制性酶切位點RY,DNA片段D,限制性酶切位點RZ,可退火接頭序列LB,和限制性酶切位點RB。在其它實施方式里,輸入載體是環(huán)形多核苷酸并以5’至3’方向包含限制性酶切位點RA,引物結(jié)合片段PA或者可退火接頭序列 LA,限制性酶切位點RY,DNA片段D,限制性酶切位點RZ,引物結(jié)合片段PB或者可退火接頭序列LB,和限制性酶切位點RB。在一些實施方式里,輸入載體的DNA片段D的序列是lac Z報告基因。IacZ報告基因用于通過藍(lán)/白篩選來區(qū)分于轉(zhuǎn)化了包含IacZ之外的DNA片段的載體克隆,例如,在制備本文所描述的裝配載體的過程中。在一些實施方式里,輸入載體是環(huán)形多核苷酸并以5’至3’方向包含限制性酶切位點RA,可退火接頭序列LA,限制性酶切位點RY,DNA片段D,限制性酶切位點RZ,和限制性酶切位點RB (即,5,-RA-LA-RY-D-RZ-RB-3,)。在一些實施方式里,輸入載體是環(huán)形多核苷酸并以 5,至3,方向包含限制性酶切位點RA,限制性酶切位點RY, DNA片段D,限制性酶切位點 RZ,可退火接頭序列LB,和限制性酶切位點RB(即,5,-RA-RY-D-RZ-LB-RB-3,)。在一些實施方式里,輸入載體是環(huán)形多核苷酸并以5’至3’方向包含限制性酶切位點RA,可退火接頭序列LA,限制性酶切位點 RY, DNA片段D,限制性酶切位點RZ,可退火接頭序列LB,和限制性酶切位點RB (即, 5,-RA-LA-RY-D-RZ-LB-RB-3')。在一些實施方式里,輸入載體是環(huán)形多核苷酸并以5,至 3’方向包含限制性酶切位點RA,引物結(jié)合片段PA,限制性酶切位點RY,DNA片段D,限制性酶切位點RZ,可退火接頭序列LB,和限制性酶切位點RB(即,5,-RA-PA-RY-D-RZ-LB-RB-3,)。在一些實施方式里,輸入載體是環(huán)形多核苷酸并以5’至3’方向包含限制性酶切位點RA,可退火接頭序列LA,限制性酶切位點RY, DNA片段D,限制性酶切位點RZ,引物結(jié)合片段PB,和限制性酶切位點RB(即, 5,-RA-LA-RY-D-RZ-PB-RB-3‘)。圖IA提供了一個示例性的輸入載體。引物結(jié)合片段可以是與用于制造裝配好的多核苷酸的任意可退火接頭序列不互補的任何核苷酸序列。在一些實施方式里,兩個引物結(jié)合片段包括限制性內(nèi)切酶識別和切斷位點。在一些實施方式里,引物結(jié)合片段僅僅是不用于特定的裝配反應(yīng)接頭序列。在一些實施方式里,引物結(jié)合片段PA的核酸序列選自SEQ ID NO : 和25。在一些實施方式里, 引物結(jié)合片段PB的核酸序列選自SEQ ID NO : 和25。在一些實施方式里,引物結(jié)合片段 PA和引物結(jié)合片段PB的核酸序列選自SEQ ID NO : 和25。在優(yōu)選實施方式里,PA和PB 在序列上是不完全相同的。在一些實施方式里,可退火接頭序列LA或LB的核酸序列為至少M個核苷酸并具有至少60°C的Tm。在一些實施方式里,可退火接頭序列LA的核酸序列選自SEQ ID NO 1-23。在一些實施方式里,可退火接頭序列LB的核酸序列選自SEQ ID NO :1_23。在一些實施方式里,可退火接頭序列LA和可退火接頭序列LB的核酸序列選自SEQ ID NO :1_23。限制性酶切位點RY和RZ可用作克隆位點以引入各種DNA片段,從而產(chǎn)生裝配載體。在一些實施方式里,RY和RZ在序列上不相同。在一些實施方式里,RY和RZ可以被相同的限制性內(nèi)切酶切斷。在一些實施方式里,RY和RZ在序列上相同。在一些實施方式里, 限制性酶切位點RY和RZ可以被產(chǎn)生交錯末端的限制性內(nèi)切酶切斷,即,末端具有5’或3’ 突出。在其它實施方式里,限制性酶切位點RY和RZ可以被產(chǎn)生平末端的限制性內(nèi)切酶切斷。盡管限制性酶切位點RY和RZ可以是本領(lǐng)域已知的任何限制性酶切位點,被IIS 型限制性內(nèi)切酶識別的限制性酶切位點尤其有用。IIS型限制性內(nèi)切酶具有與其切斷區(qū)域不同的DNA結(jié)合區(qū)域。因此,它們識別一個特定的序列但是在一定距離之外切斷。例如,IIS 型限制性內(nèi)切酶khl (也稱為MlyI)結(jié)合包含序列GAGTC的識別位點,而切斷距離識別位點四個⑷堿基對處,形成平末端DNA分子。IIS型限制性酶切位點在由輸入載體制備裝配載體時尤其有用。例如,在這樣的亞克隆過程中,其中輸入載體的DNA片段,例如lacZ,用感興趣的DNA片段代替,則具有IIS型限制性內(nèi)切酶的IacZ的切除能夠?qū)е略撓拗菩悦盖形稽c識別序列的完全移除。從而,在連接所述感興趣的DNA片段和線形化輸入載體之后,可退火接頭序列或者引物結(jié)合片段與新引入的DNA片段之間的額外序列是最小的。因此,在一些實施方式里,限制性酶切位點RY和RZ是本領(lǐng)域已知的任何IIS型限制性內(nèi)切酶能夠識別和切斷的限制性酶切位點。合適的IIS型限制性內(nèi)切酶包括但不限于下列核酸內(nèi)切酶及其同裂酶,以字母順序排列:Alw26I (BsmAI), AlwI(AclffI, BinI), AsuHPI(HphI),BbvI (Bst71I),Bcefl, BstF5I(BseGI, FokI),F(xiàn)auI, HgaI, SapI(LguI), MboII, PleI, SapI, SchI(MlyI), SfaNI,和 TspRI, AceIII, BbsI(BbvII, BpiI, BpuAI), Bce83I, BciVI, BfiI(BmrI), BpmI(GsuI), BsaI(Eco31I), BseRI, BsgI, BsmBI (Esp3I), BsmFI, BspMI, BsrDI (Bse3DI),Bsu6I(Eaml1041,Earl, Ksp632I),Eco57I, FauI, MmeI, IUeAI,TaqII,和Tthl 1111。在特別的實施方式里,限制性酶切位點RY和RZ能夠被SchI限制性內(nèi)切酶識別和切斷。在一些實施方式里,RA和RB在序列上不相同。在一些實施方式里,RA和RB可以被相同的限制性內(nèi)切酶切斷。在一些實施方式里,RA和RB在序列上相同。在一些實施方式里,限制性酶切位點RA和RB可以被產(chǎn)生交錯末端的限制性內(nèi)切酶切斷,即,末端具有5’ 或3’突出。在其它實施方式里,限制性酶切位點RA和RB可以被產(chǎn)生平末端的限制性內(nèi)切酶切斷。盡管限制性酶切位點RA和RB可以是本領(lǐng)域已知的任何限制性酶切位點,在一種或多種生物的DNA(例如,cDNA)內(nèi)相對不頻繁的限制性酶切位點(即,不常見切斷點)尤其有用。在一些實施方式里,限制性酶切位點RA和RB被在人類DNA中相對不頻繁的限制性酶切位點的限制性內(nèi)切酶識別和切斷。在一些實施方式里,限制性酶切位點RA和RB被在鼠 DNA中相對不頻繁的限制性酶切位點的限制性內(nèi)切酶識別和切斷。在一些實施方式里,限制性酶切位點RA和RB被在酵母DNA中相對不頻繁的限制性酶切位點的限制性內(nèi)切酶識別禾口切斷,例如,在Saccharomyces cerevisiae, Pichia pastoris, Kluyveromyces lactis, Arxula adeninivorans,或者 Hansenula poIymorpha 的 DNA 中。在一些實施方式里,限制性酶切位點RA和RB被在細(xì)菌DNA中幾乎沒有限制性酶切位點的限制性內(nèi)切酶識別和切斷, 例如,在 Escherichia coli 或者 Bacillus subtilis 的 DNA 中。在一些實施方式里,限制性酶切位點RA和RB被IIS型限制性內(nèi)切酶識別和切斷, 其識別位點是例如包含PA/LA-D-PB/LB的多核苷酸序列的末梢。在一些實施方式里,限制性酶切位點RA和RB各自獨立的可以被選自下列的限制性內(nèi)切酶切斷MssI,NruI (Bsp68I, MluB2I, Sbol3I, SpoI),SnaBI (BstSNI, Ecol05I),SrfI,和 SwaI(BstRZ246I, BstSffI, MspSffI, SmiI),HpaI,HincII, PshAI,OliI,AluI, Alw26I, Ball, DraI, DpnI,Ec 和 47111, Ec 和 CRI,Ec 和 V,F(xiàn)okI, HaeIII,HincII,MboI, MspAlI,NaeI, RsaI, PvuII,Seal, SmaI, SspI,StuI,XmnI,EcaBC3I, SciI, HincII, DraI, BsaBI, Cac8I,Hpy8I, MlyI, PshAI, SspD51, BfrBI,BsaAI,BsrBI,BtrI,CdiI,CviJI,CviRI,Eco47III,Eco78I,EcoICRI,F(xiàn)nuDII,F(xiàn)spAI, HaeI, LpnI, MlyI, MslI, MstI, NaeI, NlaIV, NruI, NspBII, OliI, PmaCI, PshAI,Psil,SrfI, StuI, XcaI, XmnI, Zral,及其同裂酶。在一個特別的實施方式里,限制性酶切位點RA和RB 被SapI或LguI限制性內(nèi)切酶識別并切斷。LguI是SapI的同裂酶,具有相同的識別和切斷特異性。在一些實施方式里,本發(fā)明提供的輸入載體也包含一個或多個在載體的復(fù)制,保持,或整合(例如,復(fù)制起點)中起作用的核酸序列,以及一個或多個選擇性標(biāo)記。復(fù)制起點是一種獨特的多核苷酸,包含多個短重復(fù)序列并可以被多亞基起始結(jié)合蛋白所識別,從而在裝配DNA復(fù)制酶在起始位點起著關(guān)鍵性作用。本發(fā)明提供的輸入載體和裝配載體中使用的合適的復(fù)制起點包括但不限于E. coli oriC, colEl質(zhì)粒origin,2 μ和ARS (均用于酵母系統(tǒng)),sfl,SV40EBV oriP (用于哺乳動物系統(tǒng)),或者在pSClOl中發(fā)現(xiàn)的這些。選擇性標(biāo)記是載體中的有用元件,因為它們提供促進(jìn)或抑制細(xì)胞生長而篩選成功轉(zhuǎn)化了包含選擇性標(biāo)記的載體并表達(dá)該標(biāo)記的細(xì)胞的方法。在一些實施方式里,任何載體均可用于構(gòu)建本發(fā)明提供的輸入載體。特別是,本領(lǐng)域已知的載體和商業(yè)上可獲得的載體(及其變體或衍生物)可以被加工為包括限制性酶切位點RA,可選的引物結(jié)合片段PA或可退火接頭序列LA,限制性酶切位點RY,DNA片段D,限制性酶切位點RZ,可選的引物結(jié)合片段PB或可退火接頭序列LB,和限制性酶切位點RB,以用于本發(fā)明提供的方法。這種載體可以例如從以下源獲得=Vector Laboratories Inc. , InVitrogen, Promega, Novagen, NEB, Clontech, Boehringer Mannheim, Pharmacia, EpiCenter, OriGenes Technologies Inc. , Stratagene, Perkin Elmer, Pharmingen, Life Technologies, Inc.,和Research Genetics。尤其吸引人的常規(guī)載體種類包括真核和/或原核克隆載體,表達(dá)載體,融合載體,雙雜交或反向雙雜交載體,用于不同宿主的穿梭載體, 突變載體(mutagenesis vector),轉(zhuǎn)錄載體,接受大的插入片段的載體,等等。感興趣的其它載體包括病毒源載體(M13載體,噬菌體λ載體,腺病毒載體,和反轉(zhuǎn)錄病毒載體),高、低和合適拷貝數(shù)目的載體,具有兼容性復(fù)制子以用于在單一宿主中組合的載體(PACYC184和 PBR322)和真核附加體(印isomal)復(fù)制載體(pCDM8)。在一個特別的實施方式里,用于本發(fā)明提供的方法的輸入載體是pRYSE載體,其具有SEQ ID NO 207到221的核苷酸序列。圖4提供了 pRYSE載體的示意圖,而pRYSE載體的制備在下文實施例1中描述。5. 6裝配載體在另一方面,本發(fā)明提供了載體,S卩,裝配載體,用于將多種組分多核苷酸裝配進(jìn)入一種或多種裝配好的多核苷酸。在一些實施方式里,裝配載體是環(huán)形多核苷酸并包含選擇性標(biāo)記,復(fù)制起點,和DNA片段,該DNA片段側(cè)鄰于可退火接頭序列、可退火接頭序列對或者可退火接頭序列/引物結(jié)合片段對,并側(cè)鄰于一對限制性酶切位點。限制性酶切位點有益于在裝配反應(yīng)中將組分多核苷酸從裝配載體骨架上切除出來。因此,在一些實施方式里, 裝配載體是環(huán)形多核苷酸并以5’至3’方向包含限制性酶切位點RA,引物結(jié)合片段PA或可退火接頭序列LA,DNA片段D,和限制性酶切位點RB。在一些實施方式里,裝配載體是環(huán)形多核苷酸并以5’至3’方向包含限制性酶切位點RA,DNA片段D,引物結(jié)合片段PB或可退火接頭序列LB,和限制性酶切位點RB。在某些實施方式里,裝配載體是環(huán)形多核苷酸并以5’至3’方向包含限制性酶切位點RA,引物結(jié)合片段PA或可退火接頭序列LA,DNA片段D,引物結(jié)合片段PB或可退火接頭序列LB,和限制性酶切位點RB。在一些實施方式里,裝配載體是環(huán)形多核苷酸并以5 ’至3 ’方向包含限制性酶切位點RA,可退火接頭序列LA,DNA片段D,和限制性酶切位點RB ( S卩,5,-RA-LA-D-RB-3,)。在一些實施方式里,裝配載體是環(huán)形多核苷酸并以5’至3’方向包含限制性酶切位點RA,DNA 片段D,可退火接頭序列LB,和限制性酶切位點RB( S卩,5,-RA-D-LB-RB-3,)。在一些實施方式里,裝配載體是環(huán)形多核苷酸并以5’至3’方向包含限制性酶切位點RA,可退火接頭序列LA,DNA片段D,可退火接頭序列LB,和限制性酶切位點RB ( S卩,5,-RA-LA-D-LB-RB-3‘)。 在一些實施方式里,裝配載體是環(huán)形多核苷酸并以5’至3’方向包含限制性酶切位點RA,引物結(jié)合片段PA,DNA片段D,可退火接頭序列LB,和限制性酶切位點RB(艮口, 5’ -RA-PA-D-LB-RB-3')。在一些實施方式里,裝配載體是環(huán)形多核苷酸并以5’至3’方向包含限制性酶切位點RA,可退火接頭序列LA,DNA片段D,引物結(jié)合片段PB,和限制性酶切位點RB (即,5,-RA-LA-D-PB-RB-3,)。圖IB和圖2提供了示例性的裝配載體。在一些實施方式里,引物結(jié)合片段PA的核酸序列選自SEQ ID NO : 和25。在一些實施方式里,引物結(jié)合片段PB的核酸序列選自SEQ ID NO : 和25。在一些實施方式里, 引物結(jié)合片段PA和引物結(jié)合片段PB的核酸序列選自SEQ ID NO : 和25。在優(yōu)選實施方式里,PA和PB在序列上是不完全相同的。在一些實施方式里,可退火接頭序列LA或LB的核酸序列為至少M個核苷酸并具有至少60°C的Tm。在一些實施方式里,可退火接頭序列LA的核酸序列選自SEQ ID NO 1-23。在一些實施方式里,可退火接頭序列LB的核酸序列選自SEQ ID NO :1_23。在一些實施方式里,可退火接頭序列LA和可退火接頭序列LB的核酸序列選自SEQ ID NO :1_23。在一些實施方式里,RA和RB在序列上不相同。在一些實施方式里,RA和RB可以被相同的限制性內(nèi)切酶切斷。在一些實施方式里,RA和RB在序列上相同。在一些實施方式里,限制性酶切位點RA和RB可以被產(chǎn)生交錯末端的限制性內(nèi)切酶切斷,即,末端具有5’或3’突出。在其它實施方式里,限制性酶切位點RA和RB可以被產(chǎn)生平末端的限制性內(nèi)切酶切斷。盡管限制性酶切位點RA和RB可以是本領(lǐng)域已知的任何限制性酶切位點,在一種或多種生物的DNA(例如,cDNA)內(nèi)相對不頻繁出現(xiàn)的限制性酶切位點(即,不常見切斷點)尤其有用。在一些實施方式里,限制性酶切位點RA和RB被在人類DNA中相對不頻繁出現(xiàn)的限制性酶切位點的限制性內(nèi)切酶識別和切斷。在一些實施方式里,限制性酶切位點 RA和RB被在鼠DNA中相對不頻繁出現(xiàn)的限制性酶切位點的限制性內(nèi)切酶識別和切斷。在一些實施方式里,限制性酶切位點RA和RB被在酵母DNA中相對不頻繁出現(xiàn)的限制性酶切位點的限制性內(nèi)切酶識別和切斷,例如,在&iccharomyces cerevisiae,Pichia pastoris, Kluyveromyces lactis, Arxula adeninivorans,或者 Hansenula poIymorpha 的 DNA 中。 在一些實施方式里,限制性酶切位點RA和RB被在細(xì)菌DNA中幾乎不存在的限制性酶切位點的限制性內(nèi)切酶識別和切斷,例如,在Escherichia coli或者BacilIus subtilis的DNA 中。在一些實施方式里,限制性酶切位點RA和RB被IIS型限制性內(nèi)切酶識別和切斷。Iis型限制性內(nèi)切酶的示意性實例包括但不限于=MssLNruI (Bsp68I,MluB2I,Sbol3I, SpoI),SnaBI (BstSNI,Ecol05I),SrfIjP SwaI (BstRZ246I, BstSffI, MspSffI, SmiI),HpaI, HincII,PshAI,OliI,AluI,Alw26I,Ball,DraI,DpnI,Ec 和 47111,Ec 和 CRI,Ec 和 V,F(xiàn)okI, HaeIII,HincII,MboI,MspAlI,NaeI,RsaI,PvuII,Seal, SmaI,SspI,StuI,XmnI,EcaBC3I, SciI, HincII, DraI, BsaBI, Cac8I, Hpy8I, MlyI, PshAI, SspD51, BfrBI, BsaAI, BsrBI, BtrI, CdiI, CviJI, CviRI, Eco47III, Eco78I, EcoICRI, FnuDII, FspAI, HaeI, LpnI, MlyI, MslI, MstI,NaeI,NlaIV, NruI, NspBII,OliI,PmaCI,PshAI, PsiI,SrfI, StuI,XcaI, XmnI,ZraI, 及其同裂酶。在一個特別的實施方式里,限制性酶切位點RA和RB被SapI或LguI限制性內(nèi)切酶識別并切斷。優(yōu)選地,裝配載體的DNA片段不包含能切斷所述裝配載體中RA和RB任一限制性酶切位點的限制性內(nèi)切酶識別和切斷的核酸序列。這使得所述DNA片段在裝配反應(yīng)的第一階段能保持完整,期間組分多核苷酸被從裝配載體骨架中切除出來。在特別的實施例里,所述DNA不含Sapl/Lgul位點,而RA和RB能被SapI或LguI切斷。在將所述DNA 片段連接進(jìn)入輸入載體之前或之后,可以通過定點突變(參見Carter,Bi°Chem. J. 237 1-7(1986) ;Zoller 禾口 Smith, Methods Enzymo 1. 154 :329-50 (1987)),盒式誘變,限制性選擇誘變(Wells et al.,Gene 34 :315-323 (1985)),寡核苷酸借到的(定點)誘變,PCR誘變,或其它已知技術(shù)可以用于修飾所述DNA片段中的任何序列。在一些實施方式里,本發(fā)明提供的裝配載體也包含一個或多個在載體的復(fù)制,保持,或整合(例如,復(fù)制起點)中起作用的核酸序列,以及一個或多個選擇性標(biāo)記。復(fù)制起點是獨特的多核苷酸,包含多個短重復(fù)序列并可以被多亞基起始結(jié)合蛋白所識別,從而在裝配DNA復(fù)制酶在起始位點起關(guān)鍵性作用。本發(fā)明提供的輸入載體和裝配載體中使用的合適的復(fù)制起點包括但不限于E. coli OriC,colEl質(zhì)粒origin,2 μ和ARS(均用于酵母系統(tǒng)),sfl,SV40EBV oriP (用于哺乳動物系統(tǒng)),或者在pSClOl中發(fā)現(xiàn)的這些。選擇性標(biāo)記是載體中的有用元件,因為它們提供通過促進(jìn)或抑制細(xì)胞生長而篩選成功轉(zhuǎn)化了包含選擇性標(biāo)記的載體并表達(dá)該標(biāo)記的細(xì)胞的方法。
在一些實施方式里,任何載體均可用于構(gòu)建本發(fā)明提供的裝配載體。特別是,本領(lǐng)域已知的載體和商業(yè)上可獲得的載體(及其變體或衍生物)可以被加工為包含限制性酶切位點RA,可選的引物結(jié)合片段PA或可退火接頭序列LA,DNA片段D,可選的引物結(jié)合片段PB或可退火接頭序列LB,和限制性酶切位點RB,以用于本發(fā)明提供的方法。這種載體可以例如從以下來源獲得:Vector Laboratories Inc. , InVitrogen, Promega, Novagen, NEB, Clontech, Boehringer Mannheim, Pharmacia, EpiCenter, OriGenes Technologies Inc. , Stratagene, Perkin Elmer, Pharmingen, Life Technologies, Inc.,禾口 Research (Genetics。尤其吸引人的常規(guī)載體種類包括真核和/或原核克隆載體,表達(dá)載體,融合載體,雙雜交或反向雙雜交載體,用于不同宿主的穿梭載體,突變載體(mutagenesis vector),轉(zhuǎn)錄載體,接受大的插入片段的載體,等等。感興趣的其它載體包括病毒源載體 (M13載體,噬菌體λ載體,腺病毒載體,和反轉(zhuǎn)錄病毒載體),高,低和合適拷貝數(shù)目的載體,具有兼容性復(fù)制子以用于在單一宿主中組合的載體(PACYC184和pBR32》和真核附加體(印isomal)復(fù)制載體(pCDM8)。裝配載體可以由輸入載體制備。為了從輸入載體制備裝配載體,輸入載體用一種或多種可以切斷RY和RZ限制性內(nèi)切酶消化,從而線形化所述載體,使其能接受DNA片段。所述DNA片段可以通過標(biāo)準(zhǔn)克隆技術(shù)連接進(jìn)RY和RZ位點以形成本發(fā)明的裝配載體。 例如,所述DNA片段可以從以下途徑獲得通過本領(lǐng)域已知的標(biāo)準(zhǔn)程序從克隆DNA(例如, DNA “文庫”),通過化學(xué)合成,通過cDNA克隆,或者通過基因組DNA克隆,或其片段,從確定的細(xì)胞純化,或通過PCR擴增和克隆。參見,例如,Sambrook et al. ,Molecular Cloning, A Laboratory Manual,3d. ed. , Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York (2001) ;Glover, D. M. (ed.), DNA Cloning :A Practical Approach, 2d. ed.,MRL Press, Ltd.,Oxford, U. K. (1995)。裝配載體也可以從另一個載體來制備,所述載體不包含可退火接頭序列,可退火接頭序列對,或者側(cè)鄰于DNA片段插入位點的可退火接頭序列/引物結(jié)合片段對。為了從這樣的載體來制備裝配載體,所述載體用一種或多種能在適合插入DNA片段的位點切斷該載體的限制性內(nèi)切酶消化,例如在多克隆位點,從而線形化該載體使其能接受DNA片段。要插入的DNA片段可以通過本領(lǐng)域已知的標(biāo)準(zhǔn)過程來獲得,例如,克隆,化學(xué)合成,或PCR擴增。 所述DNA片段包含側(cè)鄰于可退火接頭序列、可退火接頭序列對或者可退火接頭序列/引物結(jié)合片段對的DNA片段。從而,在一些實施方式里,所述DNA片段以5’至3’方向包含可退火接頭序列LA或者引物結(jié)合片段PA,DNA片段D,和可退火接頭序列LB或引物結(jié)合片段 PB (即,5,-LA-D-LB-3,或 5,-PA-D-LB-3,或 5,-LA-D-PB-3,)。在一些實施方式里,所述 DNA片段以5,至3,方向包含DNA片段D,和可退火接頭序列LB或引物結(jié)合片段PB (即, 5’ -D-LB-3’或5’ -D-PB-3’ )。在一些實施方式里,所述DNA片段以5’至3’方向包含可退火接頭序列LA或引物結(jié)合片段PA,和DNA片段D ( S卩,5’ -LA-D-3’或5’ -PA-D-3’ )。所述DNA片段可以進(jìn)一步包含一對限制性酶切位點,其側(cè)鄰于可退火接頭序列、可退火接頭序列對或者可退火接頭序列/引物結(jié)合片段對,并且限制性內(nèi)切酶切斷產(chǎn)生的末端與線形化DNA的片段將要插入的載體所產(chǎn)生的末端相匹配??蛇x的,所述DNA片段可以在產(chǎn)生時就包含這樣的匹配末端而不需要額外的限制性內(nèi)切酶消化來產(chǎn)生匹配末端。DNA片段與線形化載體連接產(chǎn)生裝配載體之后,用于產(chǎn)生匹配末端的限制性酶切位點被保持以作為裝配載體的限制性酶切位點RA和RB。或者,所述連接可以移除原始限制性酶切位點但是另外的限制性酶切位點可以出現(xiàn)在線形化的載體中,并作為裝配載體的限制性酶切位點RA和RB。下文實施例6提供了從輸入載體(即,pRYSE)或者從另一個載體(即,pMULE載體)產(chǎn)生裝配載體的示例性方法。5. 7可退火接頭序列在另一方面,本發(fā)明提供了可退火接頭序列,其側(cè)鄰于位于輸入載體和裝配載體之內(nèi)的DNA片段??赏嘶鸾宇^序列在裝配反應(yīng)中提供相鄰組分多核苷酸之間的序列重疊, 從而起動組分多核苷酸裝配進(jìn)入裝配好的多核苷酸。從而,在優(yōu)選的實施方式里,輸入載體和裝配載體的可退火接頭序列LA和LB被優(yōu)化以在裝配反應(yīng)期間為互補可退火接頭序列提供有效和準(zhǔn)確的引發(fā)。在一些實施方式里,可退火接頭序列的長度足夠長以提供與其互補可退火接頭序列的足夠特異性,同時足夠短以在裝配反應(yīng)的退火溫度下能容易地退火。在一些實施方式里,可退火接頭序列的長度是足夠長以允許宿主細(xì)胞介導(dǎo)的與互補可退火接頭序列之間的同源重組。在一些實施方式里,可退火接頭序列為大約5,10,15,20,25,30,35,40,45,50,55, 60,65,70,75,或80個核苷酸長度。在一些實施方式里,可退火接頭序列為至少10,12,14, 16,18,20,22,24, 26, 28,或30個核苷酸長度。在一些實施方式里,可退火接頭序列為大于 30,40,50,60,70,80,90,100,500,1000,5000,或 10,000 個核苷酸長度。在一些實施方式里,可退火接頭為至少18和核苷酸長度并且是可以被3整除的數(shù)字,從而當(dāng)連接在編碼DNA 片段中時,能便于通讀接頭的轉(zhuǎn)錄物。在特別的實施方式里,可退火接頭是18,21,M,27, 30,33,36,39,42,45,48,51,54,57,或 60 個核苷酸長度。在一些實施方式里,可退火接頭序列具有相對高的解鏈溫度(Tm),S卩,在該溫度下退火的可退火接頭序列雙鏈體的一半將分離以成為單鏈??赏嘶鸾宇^的1可以根據(jù) SantaLucia, PNAS,95 :-1460-1465(1998)用最接近鄰居算法計算得出。相對高的Tm可以在裝配反應(yīng)中提供更高特異性的配對。相對高的Tm也可以允許PCR的退火和延伸步驟的組合,或者減少調(diào)整PCR的退火和延伸步驟之間的溫度所需要的時間的量,從而使用本發(fā)明的裝配方法具有更高的效率。因此,在一些實施方式里,可退火接頭序列雙鏈體具有大約 600C _80°C的Tm。在一些實施方式里,可退火接頭序列雙鏈體具有大約65°C _75°C的Tm。在一些實施方式里,可退火接頭序列雙鏈體具有大于50°C,55°C,6°C,65°C,70°C,75°C,80°C, 85°C,或 90°C 的 Tm。在一些實施方式里,可退火接頭序列在本文描述的方法的條件下不通過分子內(nèi) (即,在相同分子內(nèi))作用形成明顯的二級結(jié)構(gòu)(例如,發(fā)卡,自二聚體),在DNA水平或 RNA水平或DNA和RNA水平均如此。DNA出現(xiàn)二級結(jié)構(gòu)會導(dǎo)致裝配反應(yīng)產(chǎn)生很少或沒有產(chǎn)生裝配好的多核苷酸。RNA出現(xiàn)二級結(jié)構(gòu)會導(dǎo)致翻譯效率降低,當(dāng)退火接頭序列用于將包含啟動子和蛋白質(zhì)編碼序列的組分多核苷酸裝配為裝配好的多核苷酸時,可退火接頭序列位于啟動子和蛋白質(zhì)編碼序列之間,這時候RNA的二級結(jié)構(gòu)尤其具有重要影響。從而,用于本發(fā)明的裝配方法的可退火接頭序列被設(shè)計為不形成RNA和/或DNA 二級結(jié)構(gòu)??赏嘶鸾宇^序列形成RNA或DNA 二級結(jié)構(gòu)的能力可以使用軟件工具來確定,例如,IDT Oligo Analyzer(Integrated DNA Technologies, Coralville, ΙΑ), mFold(Zuker 2003 NucleicAcids Res. 31 (13) ,3406-15),或 RNAfold (Hofacker & StadleH2006) Bioinformatics 22(10) :1172-6)。通常來說,這些工具計算序列從線形轉(zhuǎn)變?yōu)檎郫B狀態(tài)的吉布斯自由能 (AG)。AG越大,則該序列越不會形成二級結(jié)構(gòu)。從而,在一些實施方式中,可退火接頭序列被設(shè)計為具有從線形轉(zhuǎn)變?yōu)檎郫B狀態(tài)的大的AG值。在一些實施方式里,可退火接頭序列設(shè)計為從線形轉(zhuǎn)變?yōu)檎郫B狀態(tài)的Δ G值等于或大于Mccharomyces cerevisiae基因組中高表達(dá)基因的編碼序列的直接上游的η個堿基由線形轉(zhuǎn)變?yōu)檎郫B狀態(tài)的AG值,其中η 表示可退火接頭序列中的堿基數(shù)目的整數(shù)。在一些實施方式里,可退火接頭序列為36個堿基長度并具有從線形轉(zhuǎn)變?yōu)檎郫B狀態(tài)的AG值為-1或更大。在一些實施方式里,可退火接頭序列被設(shè)計為避免不希望出現(xiàn)的分子間作用 (即,在不同分子間)。從而,在一些實施方式里,可退火接頭序列基本上不與包含可退火接頭序列的裝配載體(例如,載體骨架序列)的其它任何序列退火,和/或不與在本發(fā)明提供的多核苷酸裝配方法所需要的互補可退火接頭序列之外的裝配組合物的其它載體退火。在一些實施方式,可退火接頭序列基本上不與本發(fā)明提供的裝配組合物的裝配載體中的其它可退火接頭序列退火。在一些實施方式里,可退火接頭序列具有高G-C含量,S卩,可退火接頭序列中烏嘌呤和胞嘧啶的數(shù)量占可退火接頭序列中堿基總數(shù)的百分比高。具有高G-C含量的可退火接頭序列通常在本發(fā)明的方法中很有用,因為高G-C含量通常提供了高Tm,后者從而可以在裝配反應(yīng)中提供更高特異性的配對,并且允許S0E/PCR的退火和延伸步驟的組合,從而節(jié)約時間和程序。在一些實施方式里,可退火接頭序列的G-C含量在大約20-80%之間。在一些實施方式里,可退火接頭序列的G-C含量在大約40-60%之間。在一些實施方式里,可退火接頭序列的G-C含量為大約40,45,50,55,60或70%。在特定的實施方式里,可退火接頭序列具有大于70%的G-C含量。SEQ IDNO :1-8是具有高G-C含量且不形成明顯二級DNA結(jié)構(gòu),并具有70°C或更高Tm的可退火接頭序列的示意性實例。在一些實施方式里,可退火接頭序列具有高A-T含量,S卩,可退火接頭序列中腺嘌呤和胸腺嘧啶的數(shù)量占可退火接頭序列中堿基總數(shù)的百分比高。高的A-T含量可以減小可退火接頭序列形成二級結(jié)構(gòu)的傾向,這在可退火接頭序列用于將包含啟動子和蛋白質(zhì)編碼序列的組分多核苷酸裝配為裝配好的多核苷酸的過程中尤其有用,其中可退火接頭序列位于所述啟動子和蛋白質(zhì)編碼序列之間。在一些實施方式里,可退火接頭序列的A-T含量在大約20-80%之間。在一些實施方式里,可退火接頭序列的A-T含量在大約40-60%之間。 在一些實施方式里,可退火接頭序列的A-T含量為大約30,35,40,45,50,55,或60%。在一些實施方式里,可退火接頭序列具有大于30%的A-T含量。在一些實施方式里,可退火接頭序列的最3’端的沈個堿基的序列符合下列共有基序5,-ANNNNNNNNANNNAANTANNTTNANA-3,,其中 A 代表腺嘌呤,N 代表任意核苷酸,T 代表胸腺嘧啶。該共有基序在Mccharomyces cerevisiae基因組中高表達(dá)基因的起始密碼子的上游沈個堿基出頻繁出現(xiàn)。SEQ ID NO :9-23是包含該共有基序,具有相對高的A-T 含量,不形成明顯的RNA或DNA 二級結(jié)構(gòu),并具有60°C或更高的Tm的可退火接頭序列的示意性實例。在一些實施方式里,可退火接頭序列包含一個或多個限制性酶切位點。可退火接頭序列中含有限制性酶切位點使得從輸入或裝配載體中切除DNA片段的同時能將限制性酶切位點RA和RB保持在輸入載體或裝配載體之中??赏嘶鸾宇^序列的限制性酶切位點有利于正向克隆DNA片段進(jìn)入其它輸入或裝配載體。這一特征有利于高效構(gòu)建包含同樣的 DNA片段但是具有不同可退火接頭序列對或者引物結(jié)合片段/可退火接頭序列對的裝配載體,例如,以產(chǎn)生包含下文所述的不同可退火接頭序列的裝配載體的文庫。這一特征也可以在構(gòu)建包含所述DNA片段的其它裝配載體時避免需要再擴增和測序該DNA片段。從而,在一些實施方式里,可退火接頭序列包含獨特的限制性酶切位點。在一些實施方式里,所述限制性酶切位點是7堿基對限制性酶切位點,即,它可以被識別7堿基對核酸序列的限制性內(nèi)切酶切斷。在一些實施方式里,所述限制性酶切位點是8堿基對限制性酶切位點。在特別的實施方式里,可退火接頭序列內(nèi)的限制性酶切位點可以被MreI,F(xiàn)seI,SbΠ,ASiSI,N0tI, AscI,或KdvCI識別和切斷。在一些實施方式里,可退火接頭序列包含使其在連接至編碼DNA片段后能通讀轉(zhuǎn)錄物的序列。在一些實施方式里,可退火接頭序列允許以5’至3’和3’至5’方向通讀轉(zhuǎn)錄物。在這些實施方式里,可退火接頭序列的長度優(yōu)選地為被三C3)整除的數(shù)目的核苷酸。在特別的實施方式里,可退火接頭序列不包含在hcherichia coli (E. coli)或者 Saccharomyces cerevisiae (S. cerevisiae)中的稀有密石馬子。E. coli 或 S. cerevisiae 中異源基因的有效表達(dá)可以被不常見密碼子負(fù)面影響,而當(dāng)稀有密碼子被更常見密碼子取代時,異源蛋白的表達(dá)水平通常會提高。參見,例如,Williams et al. , Nucleic Acids Res. 16 :10453-10467,1988 和 Hoog et al. ,Gene 43:13-21,1986。從而,包含讀通序列的可退火接頭序列優(yōu)選不包含E. coli或S. cerevisiae中的稀有密碼子,以便于包含可退火接頭序列的裝配好的多核苷酸編碼的蛋白質(zhì)的有效表達(dá)。在一些實施方式里,可退火接頭序列系列是即將進(jìn)入的宿主生物中沒有的獨特序列。在一些實施方式里,可退火接頭序列系列是在E. coli中沒有的獨特序列。在其它實施方式里,可退火接頭序列系列是在S. cerevisiase中沒有的獨特序列。在一些實施方式里,合適的可退火接頭序列在測試性裝配好的多核苷酸里鑒別。 測試性裝配好的多核苷酸包含要測試的可退火接頭序列和允許可退火接頭序列測試的其它元件。例如,為了測試可退火接頭是否適合裝配包含啟動子序列的第一組分多核苷酸和包含要在裝配好的多核苷酸中處于所述啟動子控制之下的蛋白質(zhì)編碼序列的第二組分多核苷酸,可以從第一組分多核苷酸和第二組分多核苷酸來裝配測試性裝配好的多核苷酸, 其中所述第一組分多核苷酸以5’至3’方向包含引物結(jié)合片段或可退火接頭序列,包含啟動子的DNA片段,和要測試的可退火接頭序列,而所述第二組分多核苷酸以5’至3’方向包含要測試的可退火接頭序列,編碼報告基因(例如,綠色熒光蛋白(GFP))的DNA片段,和引物結(jié)合片段或可退火接頭序列。測試性裝配好的多核苷酸可以在體內(nèi)或體外測試其表達(dá)報告基因的效率。可以裝配相似的測試性多核苷酸以測試用于裝配包含含其它元件的DNA 片段的組分多核苷酸的可退火接頭序列的合適性,所述其它元件例如增強子,終止子,聚-A 尾,核定位信號,mRNA穩(wěn)定化信號,選擇性標(biāo)記,表位標(biāo)簽編碼序列,降解信號,等等。測試性裝配好的多核苷酸可以包含額外的組分多核苷酸,后者使允許測試?yán)缁蚪M靶向序列和選擇性標(biāo)記,它們使得可以在體內(nèi)測試中將測試性裝配好的多核苷酸引入宿主細(xì)胞并篩選陽性轉(zhuǎn)化株。表1展示了根據(jù)SEQ ID NO 1_23的示例性可退火接頭序列的Tm,限制性酶切位點,和通讀氨基酸。
1. 表1-可退火接頭序列的序列和表征
權(quán)利要求
1.一種組合物,其包含(a)一個或多個第一核酸分子,其中每個第一核酸分子是環(huán)形的并以5’至3’方向包含第一限制性酶切位點RAtl、選自組Dtl的任意的DNA片段、可退火接頭序列ΙΛ、和第二限制性酶切位點RBtl ;(b)一個或多個中間核酸分子,其中每個中間核酸分子η是環(huán)形的并以5’至3’的方向包含第一限制性酶切位點RAn、第一可退火接頭序列LAn、選自組Dn的任意DNA片段、第二可退火接頭序列LBn、和第二限制性酶切位點RBn,其中η表示從1到中間核酸分子數(shù)目的整數(shù);和(c)一個或多個最后核酸分子,其中每個最后核酸分子是環(huán)形的并以5’至3’的方向包含第一限制性酶切位點RAm、第一可退火接頭序列LAm、選自組Dm的任意DNA片段、和第二限制性酶切位點RBm,其中m表示比中間核酸分子數(shù)目大1的整數(shù);其中切斷RAtl至RBm的限制性酶切位點并變性所獲得的線形核酸分子之后,每個可退火接頭序列LB(p_d能夠與可退火接頭序列LAp的互補物雜交,其中η是在1到(m-Ι)范圍內(nèi)的整數(shù),其中P表示從1到m的整數(shù),并且其中每個組Dtl,. . . Dn,. . . Dffl獨立地由一個或多個 DNA片段組成。
2.權(quán)利要求1的組合物,其中每個所述一個或多個第一核酸分子進(jìn)一步包含一個引物結(jié)合片段PA,PA對于所述選自組Dtl的DNA片段位于5’位置,并且其中每個所述一個或多個最后核酸分子進(jìn)一步包含一個引物結(jié)合片段PB,PB對于選自組Dm的DNA片段位于3’位置。
3.權(quán)利要求1或2的組合物,其中切斷RAtl至RBm的限制性酶切位點并變性所獲得的線形核酸分子之后,相比于所述組合物中的其它可退火接頭序列或它們的互補物,每個可退火接頭序列LB(p_d能夠與可退火接頭序列LAp的互補物選擇性雜交。
4.權(quán)利要求1或2的組合物,其中每個可退火接頭LB(p_d與可退火接頭序列LAp或其互補物在序列上是相同的。
5.權(quán)利要求1或2的組合物,其包含一個第一核酸分子和一個最后核酸分子。
6.權(quán)利要求1或2的組合物,其中RAtl至RBm的每個限制性酶切位點都可以被IIS型限制性核酸內(nèi)切酶切斷。
7.權(quán)利要求1或2的組合物,其中RAtl至RBm的所述限制性酶切位點可以被相同的IIS 型限制性核酸內(nèi)切酶切斷。
8.權(quán)利要求1或2的組合物,其中RAtl至RBm的所述限制性酶切位點可以被限制性核酸內(nèi)切酶SapI或LguI切斷。
9.權(quán)利要求1的組合物,其中兩個或多個可退火接頭序列各自獨立地是至少M個核苷酸長,并具有至少60°C的解鏈溫度。
10.權(quán)利要求1或2的組合物,其中兩個或多個可退火接頭序列各自獨立地具有至少 70%的G-C含量和至少70°C的解鏈溫度。
11.權(quán)利要求1或2的組合物,其中兩個或多個可退火接頭序列各自獨立地具有至少 30%的A-T含量和至少65°C的解鏈溫度,并包含基序`5,ANNNNNNNNANNNAANTANNTTNANA-3,,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
12.權(quán)利要求1或2的組合物,其中兩個或多個可退火接頭序列具有選自由SEQID NO 1-23或其互補物所組成的組的序列。
13.權(quán)利要求1或2的組合物,其中每個可退火接頭序列具有選自由SEQID NO :1_23 或其互補物所組成的組的序列。
14.權(quán)利要求1或2的組合物,其中每個引物結(jié)合片段具有選自由SEQID NO :24-25或其互補物所組成的組的序列。
15.權(quán)利要求1或2的組合物,其進(jìn)一步包含一個或多個能夠切斷RBtl到?。苛贾g的限制性酶切位點的限制性核酸內(nèi)切酶。
16.權(quán)利要求8的組合物,其進(jìn)一步包含SapI或LguI限制性核酸內(nèi)切酶。
17.—種組合物,其包含用可以切斷RAtl到RBm的限制性酶切位點的限制性核酸內(nèi)切酶消化權(quán)利要求1或2所述的組合物后所形成的多個線形核酸分子。
18.權(quán)利要求17的組合物,其中每個線形核酸分子包含粘性末端。
19.權(quán)利要求2的組合物,其進(jìn)一步包含與引物結(jié)合片段PA互補的第一引物,或其互補物,和與引物結(jié)合片段PB互補的第二引物,或其互補物。
20.權(quán)利要求1或2的組合物,其進(jìn)一步包含DNA聚合酶。
21.一種組合物,其包含用SapI或LguI限制性核酸內(nèi)切酶消化權(quán)利要求8所述組合物后所形成的多個線形核酸分子。
22.—種載體,其選自(a)由環(huán)形多核苷酸組成的載體,該多核苷酸以5’到3’方向包含限制性酶切位點RA、 DNA片段D、可退火接頭序列LB、和限制性酶切位點RB ;(b)由環(huán)形多核苷酸組成的載體,該多核苷酸以5’到3’方向包含限制性酶切位點RA、 可退火接頭序列LA、DNA片段D、和限制性酶切位點RB ;(c)由環(huán)形多核苷酸組成的載體,該多核苷酸以5’到3’方向包含限制性酶切位點RA、 引物結(jié)合片段PA、DNA片段D、可退火接頭序列LB、和限制性酶切位點RB ;(d)由環(huán)形多核苷酸組成的載體,該多核苷酸以5’到3’方向包含限制性酶切位點RA、 可退火接頭序列LA、DNA片段D、可退火接頭序列LB、和限制性酶切位點RB ;和(e)由環(huán)形多核苷酸組成的載體,該多核苷酸以5’到3’方向包含限制性酶切位點RA、 可退火接頭序列LA、DNA片段D、引物結(jié)合片段PB、和限制性酶切位點RB ;其中限制性酶切位點RA和RB分別可以被IIS型限制性核酸內(nèi)切酶切斷。
23.權(quán)利要求22的載體,其中每個可退火接頭序列獨立地是至少M個核苷酸長度并具有至少60°C的解鏈溫度。
24.權(quán)利要求22的載體,其中每個可退火接頭序列獨立地具有至少70%的G-C含量并具有至少70°C的解鏈溫度。
25.權(quán)利要求22的載體,其中每個可退火接頭序列各自獨立地具有至少30%的A-T含量和至少65°C的解鏈溫度,并包含基序5,ANNNNNNNNANNNAANTANNTTNANA-3,,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
26.權(quán)利要求22的載體,其中可退火接頭序列LA和/或可退火接頭序列LB具有選自由SEQ ID NO 1-23或其互補物組成的組的序列。
27.權(quán)利要求22的載體,其中引物結(jié)合片段PA和/或引物結(jié)合片段PB具有選自由SEQ ID NO :24-25或其互補物組成的組的序列。
28.權(quán)利要求22的載體,其中限制性酶切位點RA和RB可以被相同的IIS型限制性內(nèi)切酶切斷。
29.權(quán)利要求22的載體,其中限制性酶切位點RA和RB被限制性內(nèi)切酶SapI或LguI 切斷。
30.一種載體,其選自(a)由環(huán)形多核苷酸組成的載體,該多核苷酸以5’到3’方向包含限制性酶切位點RA、 限制性酶切位點RY、DNA片段D、限制性酶切位點RZ、可退火接頭序列LB、和限制性酶切位點RB ;(b)由環(huán)形多核苷酸組成的載體,該多核苷酸以5’到3’方向包含限制性酶切位點RA、 可退火接頭序列LA、限制性酶切位點RY、DNA片段D、限制性酶切位點RZ、和限制性酶切位點RB ;(c)由環(huán)形多核苷酸組成的載體,該多核苷酸以5’到3’方向包含限制性酶切位點RA、 引物結(jié)合片段PA、限制性酶切位點RY、DNA片段D、限制性酶切位點RZ、可退火接頭序列LB、 和限制性酶切位點RB ;(d)由環(huán)形多核苷酸組成的載體,該多核苷酸以5’到3’方向包含限制性酶切位點RA、 可退火接頭序列LA、限制性酶切位點RY、DNA片段D、限制性酶切位點RZ、可退火接頭序列 LB、和限制性酶切位點RB ;和(e)由環(huán)形多核苷酸組成的載體,該多核苷酸以5’到3’方向包含限制性酶切位點RA、 可退火接頭序列LA、限制性酶切位點RY、DNA片段D、限制性酶切位點RZ、引物結(jié)合片段PB、 和限制性酶切位點RB ;其中限制性酶切位點RA和RB分別可以被IIS型限制性核酸內(nèi)切酶切斷。
31.權(quán)利要求30的載體,其中每個可退火接頭序列獨立地是至少M個核苷酸長度并具有至少60°C的解鏈溫度。
32.權(quán)利要求30的載體,其中每個可退火接頭序列獨立地具有至少70%的G-C含量并具有至少70°C的解鏈溫度。
33.權(quán)利要求30的載體,其中每個可退火接頭序列獨立地具有至少30%的A-T含量和至少65 °C的解鏈溫度,并包含基序5,ANNNNNNNNANNNAANTANNTTNANA-3,,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
34.權(quán)利要求30的載體,其中可退火接頭序列LA和/或可退火接頭序列LB具有選自由SEQ ID NO :1-23或其互補物組成的組的序列。
35.權(quán)利要求30的載體,其中引物結(jié)合片段PA和/或引物結(jié)合片段PB具有選自由SEQ ID NO 24-25或其互補物組成的組的序列。
36.權(quán)利要求30的載體,其中限制性酶切位點RA和RB可以被相同的IIS型限制性內(nèi)切酶切斷。
37.權(quán)利要求30的載體,其中限制性酶切位點RA和RB可以被限制性內(nèi)切酶SapI或 LguI切斷。
38.權(quán)利要求30的載體,其中限制性酶切位點RY和RZ可以被同樣的限制性內(nèi)切酶切斷。
39.權(quán)利要求30的載體,其中限制性酶切位點RY和RZ可以被IIS型限制性內(nèi)切酶切斷。
40.權(quán)利要求30的載體,其中限制性酶切位點RY和RZ可以被khl切斷。
41.一種用于裝配多核苷酸的試劑盒,所述試劑盒包括(a)權(quán)利要求30所要求的一個或多個載體;(b)能夠切斷所述限制性酶切位點RA和RB的一種或多種IIS型限制性內(nèi)切酶;和(c)能夠切斷所述限制性酶切位點RY和RZ的一種或多種限制性內(nèi)切酶。
42.一種核酸分子文庫,其包含以下每種載體的至少一種(a)由環(huán)形多核苷酸組成的載體,該多核苷酸以5’到3’方向包含限制性酶切位點RA、 DNA片段D、可退火接頭序列LB、和限制性酶切位點RB ;(b)由環(huán)形多核苷酸組成的載體,該多核苷酸以5’到3’方向包含限制性酶切位點RA、 可退火接頭序列LA、DNA片段D、可退火接頭序列LB、和限制性酶切位點RB ;和(c)由環(huán)形多核苷酸組成的載體,該多核苷酸以5’到3’方向包含限制性酶切位點RA、 可退火接頭序列LA、DNA片段D、和限制性酶切位點RB ;其中所述限制性酶切位點RA和RB分別可以被IIS型限制性內(nèi)切酶切斷。
43.一種核酸分子文庫,其包含以下每種載體的至少一種(a)由環(huán)形多核苷酸組成的載體,該多核苷酸以5’到3’方向包含限制性酶切位點RA、 引物結(jié)合片段PA、DNA片段D、可退火接頭序列LB、和限制性酶切位點RB ;(b)由環(huán)形多核苷酸組成的載體,該多核苷酸以5’到3’方向包含限制性酶切位點RA、 可退火接頭序列LA、DNA片段D、可退火接頭序列LB、和限制性酶切位點RB ;和(c)由環(huán)形多核苷酸組成的載體,該多核苷酸以5’到3’方向包含限制性酶切位點RA、 可退火接頭序列LA、DNA片段D、引物結(jié)合片段PB、和限制性酶切位點RB ;其中所述限制性酶切位點RA和RB分別可以被IIS型限制性內(nèi)切酶切斷。
44.權(quán)利要求42或43的文庫,其中兩個或多個可退火接頭序列各自獨立地是至少M 個核苷酸長度并具有至少60°C的解鏈溫度。
45.權(quán)利要求42或43的文庫,其中兩個或多個可退火接頭序列各自獨立地具有至少 70%的G-C含量并具有至少70V的解鏈溫度。
46.權(quán)利要求42或43的文庫,其中兩個或多個可退火接頭序列各自獨立地具有至少 30%的A-T含量和至少65°C的解鏈溫度,并包含基序5,ANNNNNNNNANNNAANTANNTTNANA-3,,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
47.權(quán)利要求42或43的文庫,其中可退火接頭序列LA和可退火接頭序列LB具有選自由SEQ ID NO 1-23或其互補物組成的組的序列。
48.權(quán)利要求43的文庫,其中引物結(jié)合片段PA和引物結(jié)合片段PB具有選自由SEQID NO 24-25或其互補物組成的組的序列。
49.權(quán)利要求42或43的文庫,其中所述DNA片段D包含選自由選擇性標(biāo)記、啟動子、基因組靶向序列、編碼表位標(biāo)簽的核酸序列、感興趣的基因、編碼終止密碼子的核酸序列和編碼IacZ的核酸組成的組的核酸序列。
50.權(quán)利要求42或43的文庫,其中限制性酶切位點RA和RB可以被同樣的IIS型限制性核酸內(nèi)切酶切斷。
51.權(quán)利要求42或43的文庫,其中限制性酶切位點RA和RB被限制性內(nèi)切酶SapI或 LguI切斷。
52.一種核酸分子文庫,其包含每種下列核酸分子的至少一個(a)第一核酸分子,其中該第一核酸分子為環(huán)形并以5’至3’的方向包含第一限制性酶切位點RV選自組Dtl的任何DNA片段、可退火接頭序列ΙΛ、和第二限制性酶切位點RBtl ;(b)中間核酸分子,其中該中間核酸分子η為環(huán)形并以5’至3’的方向包含第一限制性酶切位點RAn、第一可退火接頭序列LAn、選自組Dn的任何DNA片段、第二可退火接頭序列 LBn、和第二限制性酶切位點RBn,其中η代表從1到中間核酸分子數(shù)目的整數(shù);和(c)最后核酸分子,其中該最后核酸分子為環(huán)形并以5’至3’的方向包含第一限制性酶切位點RAm、第一可退火接頭序列LAm、選自組Dm的任何DNA片段、第二限制性酶切位點 RBm,其中m表示比中間核酸分子數(shù)目大1的整數(shù);其中RAtl至RBm的每個限制性酶切位點均被IIS性限制性內(nèi)切酶所切斷;其中切斷RAtl至RBm的限制性酶切位點并變性所獲得的線形核酸分子之后,每個可退火接頭序列LB(p_d能夠與可退火接頭序列LAp的互補物雜交,其中η是在1到(m-Ι)范圍內(nèi)的整數(shù),其中P表示一個從1到m的整數(shù),并且其中每個組Dtl,. . . Dn,. . . Dffl獨立地由一個或多個DNA片段組成。
53.權(quán)利要求52的文庫,其中所述第一核酸分子進(jìn)一步包含位于選自組Dtl的所述DNA 片段的5’位置的一個引物結(jié)合片段PA,并且所述最后核酸分子進(jìn)一步包含位于選自組Dm 的所述DNA片段的3’位置的一個引物結(jié)合片段PB。
54.權(quán)利要求52或53的文庫,其中兩個或多個可退火接頭序列各自獨立地是至少M 個核苷酸長度并具有至少60°C的解鏈溫度。
55.權(quán)利要求52或53的文庫,其中兩個或多個可退火接頭序列各自獨立地具有至少 70%的G-C含量和至少70°C的解鏈溫度。
56.權(quán)利要求52或53的文庫,其中兩個或多個可退火接頭序列各自獨立地具有至少 30%的A-T含量和至少65°C的解鏈溫度,并包含基序5,ANNNNNNNNANNNAANTANNTTNANA-3,,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
57.權(quán)利要求52或53的文庫,其中兩個或多個可退火接頭序列獨立地選自由SEQID NO 1-23或其互補物組成的組。
58.權(quán)利要求52或53的文庫,其中每個可退火接頭序列獨立地選自由SEQIDNO 1-23 或其互補物組成的組。
59.權(quán)利要求53的文庫,其中每個引物結(jié)合片段獨立地選自由SEQID NO :24-25或其互補物所組成的組。
60.權(quán)利要求52或53的文庫,其包含兩個第一核酸分子和兩個最后核酸分子,其中一個所述第一核酸分子包含DNA片段Dtll,該片段包含基因組靶向序列的第一片段,而另一個第一核酸分子包含DNA片段Dtl2,該片段包含基因組靶向序列的第二片段,其中DNA片段Dtll和Dtl2相對于這兩個第一核酸分子的限制性酶切位點RAtl和RBtl以同樣的方向排列;其中一個最后核酸分子包含DNA片段Dml,該片段編碼選擇性標(biāo)記的第一非功能片段, 而另一個第一核酸分子包含DNA片段Dm2,該片段編碼選擇性標(biāo)記的第二非功能片段,其中 DNA片段Dml和Dm2相對于這兩個最后核酸分子的限制性酶切位點RAm和RBm以相反的方向排列;并且其中所述選擇性標(biāo)記的第一非功能片段和選擇性標(biāo)記的第二非功能片段通過間隙修復(fù)而進(jìn)行的重組導(dǎo)致功能性選擇性標(biāo)記的建立。
61.一種從多個組分多核苷酸產(chǎn)生裝配好的多核苷酸的方法,該方法包括以下步驟(a)用一種或多種IIS型限制性內(nèi)切酶消化裝配組合物以產(chǎn)生組分組合物,所述裝配組合物包含(i) 一個或多個第一核酸分子,其中每個第一核酸分子是環(huán)形的并以5’至3’方向包含第一限制性酶切位點RAtl、選自組PA的任意引物結(jié)合片段、選自組Dtl的任意DNA片段、 可退火接頭序列LBtl、和第二限制性酶切位點RBtl ;( ) 一個或多個中間核酸分子,其中每個中間核酸分子η是環(huán)形的并以5’至3’的方向包含第一限制性酶切位點RAn、第一可退火接頭序列LAn、選自組Dn的任意DNA片段、第二可退火接頭序列LBn、和第二限制性酶切位點RBn,其中η表示從1到中間核酸分子數(shù)目的整數(shù);和(iii) 一個或多個最后核酸分子,其中每個最后核酸分子是環(huán)形的并以5’至3’的方向包含第一限制性酶切位點RAm、第一可退火接頭序列LAm、選自組Dm的任意DNA片段、選自組PB的任意引物結(jié)合片段、第二限制性酶切位點RBm,其中m表示比中間核酸分子數(shù)目大1 的整數(shù);其中切斷RAtl至RBm的限制性酶切位點并變性所獲得的線形核酸分子之后,每個可退火接頭序列LB(p_d能夠與可退火接頭序列LAp的互補物雜交,其中η是在1到(m-Ι)范圍內(nèi)的整數(shù),其中P表示從1到m的整數(shù),并且其中每個組Dtl,. . . Dn,. . . Dffl由一個或多個DNA 片段組成;禾口(b)使組分組合物接觸DNA聚合酶、三磷酸脫氧核糖核苷和一個或多個第一引物和一個或多個第二引物,在適合核酸分子變性的條件下,退火可退火接頭序列LB(p_d至可退火接頭序列LAp,并從此延伸;其中每個所述第一引物能夠與選自組PA的所述引物結(jié)合片段之一雜交,并且每個第二引物能夠與選自組PB的所述引物結(jié)合片段之一雜交;并且將所述組分組合物進(jìn)行聚合酶鏈?zhǔn)椒磻?yīng),其中以5’到3’方向包含分別選自組Dtl,...Dn,...和Dm的一個DNA片段的多核苷酸被裝配起來。
62.權(quán)利要求61的方法,其中一種或多種所述IIS型限制性內(nèi)切酶能夠切斷肌(|至1 1 的限制性酶切位點。
63.權(quán)利要求61的方法,其中所述裝配組合物包含一個第一核酸分子和一個最后核酸分子。
64.權(quán)利要求61的方法,其中兩個或多個可退火接頭序列各自獨立地是至少M個核苷酸長,并具有至少60°C的解鏈溫度。
65.權(quán)利要求61的方法,其中兩個或多個可退火接頭序列各自獨立地具有至少70%的 G-C含量和至少70°C的解鏈溫度。
66.權(quán)利要求61的方法,其中兩個或多個可退火接頭序列各自獨立地具有至少30%的 A-T含量和至少65°C的解鏈溫度,并包含基序5,ANNNNNNNNANNNAANTANNTTNANA-3,,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
67.權(quán)利要求61的方法,其中每個可退火接頭LB(p_d與可退火接頭序列LAp在序列上是相同的。
68.權(quán)利要求61的方法,其中所述!?^至???良的限制性酶切位點可以被相同的IIS型限制性內(nèi)切酶切斷。
69.權(quán)利要求61的方法,其中所述RAtl至RBm的限制性酶切位點可以被限制性內(nèi)切酶 SapI或LguI切斷,并且步驟(a)的限制性內(nèi)切酶是SapI或LguI0
70.權(quán)利要求61的方法,其中兩個或多個可退火接頭序列的各自獨立地選自由SEQID NO 1-23或其互補物組成的組的序列。
71.權(quán)利要求61的方法,其中每個可退火接頭序列獨立地選自由SEQID NO :1_23或其互補物組成的組的序列。
72.權(quán)利要求61的方法,其中每個引物結(jié)合片段選自由SEQID NO :24-25或其互補物組成的組。
73.權(quán)利要求61的方法,其中所述DNA聚合酶是Pfu。
74.—種產(chǎn)生包含多核苷酸的宿主細(xì)胞的方法,該方法包含如下步驟(a)用一個或多個根據(jù)權(quán)利要求61的方法裝配的多核苷酸轉(zhuǎn)化宿主細(xì)胞;和(b)篩選包含所述一個或多個裝配好的多核苷酸的宿主細(xì)胞。
75.權(quán)利要求74的方法,其中所述裝配好的多核苷酸包含選擇性標(biāo)記,并且步驟(b)包含在選擇性培養(yǎng)基中增殖宿主細(xì)胞。
76.權(quán)利要求74的方法,其進(jìn)一步包含用線形化的質(zhì)粒轉(zhuǎn)化所述宿主細(xì)胞,其中所述質(zhì)粒包含⑴與引物結(jié)合片段PA同源的第一區(qū)域;和 ( )與引物結(jié)合片段PB同源的第二區(qū)域,其中所述第一同源區(qū)域和第二同源區(qū)域具有足夠的長度以起始宿主細(xì)胞介導(dǎo)的所述多核苷酸和所述質(zhì)粒之間的同源重組,以在宿主細(xì)胞中形成環(huán)形質(zhì)粒。
77.一種制備包含多核苷酸的宿主細(xì)胞的方法,該方法包含以下步驟 (a)用組合物轉(zhuǎn)化宿主細(xì)胞,所述組合物包含(i) 一個或多個線形核酸分子,其中每個分子以5’至3’方向包含選自組Dtl的任意 DNA片段和可退火接頭序列LBtl ;( )可選地,一個或多個中間線形核酸分子,其中每個中間線形核酸分子以5’至3’方向包含第一可退火接頭序列LAn、選自組Dn的任意DNA片段、和第二可退火接頭序列LBn, 其中η表示從1到中間核酸分子數(shù)目的整數(shù);和(iii) 一個或多個最后核酸分子,其中每個最后核酸分子是環(huán)形的并以5’至3’的方向包含可退火接頭序列LAm、和選自組Dm的任意DNA片段,其中m表示比中間核酸分子數(shù)目大1的整數(shù);其中η是在1到(m-Ι)范圍內(nèi)變化的整數(shù);其中組Dtl,. . . Dn,. . . Dffl分別由一個或多個DNA片段組成;其中每個可退火接頭序列LB(p_d包含可退火接頭序列LAp的同源區(qū)域,其具有足夠長度以起始宿主細(xì)胞介導(dǎo)的LB(p_d和LAp之間的同源重組,其中ρ表示從1到m的整數(shù),其中所述同源重組導(dǎo)致多核苷酸的裝配;和(b)篩選包含裝配好的多核苷酸的宿主細(xì)胞,其中所述裝配好的多核苷酸以5’到3’方向包含分別選自組Dtl,. . . Dn,. . . Dffl的每一組的一個DNA片段。
78.權(quán)利要求77的方法,其中(a)一個或多個第一線形核酸分子的每個進(jìn)一步包含與所述宿主細(xì)胞基因組的第一整合位點同源的第一區(qū)域;和(b)一個或多個最后線形核酸分子的每個進(jìn)一步包含與所述宿主細(xì)胞基因組的第二整合位點同源的第二區(qū)域,其中所述同源區(qū)域第一同源區(qū)域和第二同源區(qū)域具有足夠長度以起始宿主細(xì)胞介導(dǎo)的與所述第一整合位點和第二整合位點之間的同源重組,其中所述同源重組導(dǎo)致裝配好的多核苷酸整合進(jìn)入所述宿主細(xì)胞基因組。
79.權(quán)利要求77的方法,其中可退火接頭序列LB(p_d和LAp的至少一個同源重組形成了編碼選擇性標(biāo)記基因的核酸序列。
80.權(quán)利要求77的方法,其中步驟(a)進(jìn)一步包含用線形化質(zhì)粒轉(zhuǎn)化所述宿主細(xì)胞,其中所述線形化質(zhì)粒包含(i)與一個或多個第一線形核酸分子同源的第一區(qū)域;和( )與一個或多個最后線形核酸分子同源的第二區(qū)域,其中所述第一同源區(qū)域和第二同源區(qū)域具有足夠長度以起始宿主細(xì)胞介導(dǎo)的裝配好的多核苷酸和所述質(zhì)粒之間的同源重組以在宿主細(xì)胞中形成環(huán)形化質(zhì)粒。
81.權(quán)利要求77的方法,其中所述組合物包含一個第一核酸分子和一個最后核酸分子。
82.權(quán)利要求77的方法,其中兩個或多個可退火接頭序列具有至少70%的G-C含量和至少70°C的解鏈溫度。
83.權(quán)利要求77的方法,其中兩個或多個可退火接頭序列具有至少30%的A-T含量和至少65 °C的解鏈溫度,并包含基序5,ANNNNNNNNANNNAANTANNTTNANA-3,,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
84.權(quán)利要求77的方法,其中每個可退火接頭序列LB(p_d與可退火接頭序列LAp在序列上是相同的。
85.包含由權(quán)利要求77的方法制備的多核苷酸的宿主細(xì)胞。
86.一種制備包含多核苷酸的宿主細(xì)胞的方法,所述方法包含如下步驟(a)用一種或多種IIS型限制性內(nèi)切酶消化組合物,所述組合物包含(i) 一個或多個第一核酸分子,其中每個第一核酸分子是環(huán)形的并以5’至3’方向包含第一限制性酶切位點RV引物結(jié)合片段PA、選自組Dtl的任意DNA片段、可退火接頭序列LB。、和第二限制性酶切位點RBtl ;( )可選地,一個或多個中間線形核酸分子,其中每個中間線形核酸分子η以5’至3’ 方向包含第一限制性酶切位點RAn、第一可退火接頭序列LAn、選自組Dn的任意DNA片段、 第二可退火接頭序列LBn、和第二限制性酶切位點RBn,其中η表示從1到中間核酸分子數(shù)目的整數(shù);和(iii) 一個或多個最后核酸分子,其中每個最后核酸分子是環(huán)形的并以5’至3’的方向包含第一限制性酶切位點RAm、可退火接頭序列LAm、選自組Dm的任意DNA片段、引物結(jié)合片段PB、第二限制性酶切位點RBm,其中m表示比中間核酸分子數(shù)目大1的整數(shù);其中切斷的RAtl至RBm限制性酶切位點并變性所獲得的線形核酸分子之后,每個可退火接頭序列 LB(p_d能夠與可退火接頭序列LAp的互補物雜交,其中ρ表示從1到m的整數(shù),其中η是在 1到(m-Ι)范圍內(nèi)的整數(shù),并且其中每個組Dtl,. . . Dn,. . . Dffl由一個或多個DNA片段組成;其中所述一種或多種IIS型限制性內(nèi)切酶能夠切斷RAtl至RBm的限制性酶切位點;和(b)用從步驟(a)獲得的消化的組合物轉(zhuǎn)化宿主細(xì)胞,其中每個可退火接頭序列LB(p_d 包含與可退火接頭序列LAp的同源區(qū)域,其具有足夠長度以起始宿主細(xì)胞介導(dǎo)的LB(p_d和 LAp之間的同源重組,其中所述同源重組導(dǎo)致所述多核苷酸的裝配,其中ρ表示從1到m的整數(shù);和(c)選擇包含所述裝配好的多核苷酸的宿主細(xì)胞,其中所述裝配好的多核苷酸以5’到 3’方向包含選自D。,...Dn,...和Dm每一組的一個DNA片段。
87.權(quán)利要求86的方法,其中(a)一個或多個第一線形核酸分子的每個進(jìn)一步包含與宿主細(xì)胞基因組的第一整合位點同源的第一區(qū)域;和(b)一個或多個最后線形核酸分子的每個進(jìn)一步包含與宿主細(xì)胞基因組的第二整合位點同源的第二區(qū)域,其中所述第一同源區(qū)域和第二同源區(qū)域具有足夠長度以起始宿主細(xì)胞介導(dǎo)的與所述第一整合位點和第二整合位點之間的同源重組,其中所述同源重組導(dǎo)致裝配好的多核苷酸整合進(jìn)入宿主細(xì)胞基因組。
88.權(quán)利要求86的方法,其中可退火接頭序列LB(p_d和LAp的至少一個同源重組形成了編碼選擇性標(biāo)記基因的核酸序列。
89.權(quán)利要求86的方法,其中步驟(b)進(jìn)一步包含用線形化質(zhì)粒轉(zhuǎn)化宿主細(xì)胞,其中所述線形化質(zhì)粒包含(i)與一個或多個第一線形核酸分子同源的第一區(qū)域;和( )與一個或多個最后線形核酸分子同源的第二區(qū)域,其中所述第一同源區(qū)域和第二同源區(qū)域具有足夠長度以起始宿主細(xì)胞介導(dǎo)的裝配好的多核苷酸和所述質(zhì)粒之間的同源重組以在宿主細(xì)胞中形成環(huán)形化質(zhì)粒。
90.權(quán)利要求86的方法,其中兩個或多個可退火接頭序列各自獨立地是至少M個核苷酸長,并具有至少60°C的解鏈溫度。
91.權(quán)利要求86的方法,其中兩個或多個可退火接頭序列各自獨立地具有至少70%的 G-C含量和至少70°C的解鏈溫度。
92.權(quán)利要求86的方法,其中兩個或多個可退火接頭序列各自獨立地具有至少30%的A-T含量和至少65°C的解鏈溫度,并包含基序(5,ANNNNNNNNANNNAANTANNTTNANA-3,,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
93.權(quán)利要求86的方法,其中每個可退火接頭LB(p_d與可退火接頭序列LAp或其互補物在序列上是相同的。
94.權(quán)利要求86的方法,其中RAtl至RBm的每個限制性酶切位點都可以被相同的IIS型限制性核酸內(nèi)切酶切斷。
95.權(quán)利要求86的方法,其中所述的RAtl至RBm限制性酶切位點可以被限制性核酸內(nèi)切酶SapI或LguI切斷,并且步驟(a)的限制性內(nèi)切酶是SapI或Lgul。
96.包含由權(quán)利要求86的方法制備的多核苷酸的宿主細(xì)胞。
97.包含選自SEQID NO :1_25的序列的多核苷酸。
98.包含權(quán)利要求97的多核苷酸的宿主細(xì)胞。
99.一種制備載體的方法,該方法包含(a)用一種或多種能夠切斷限制性位點RY和RZ的限制性內(nèi)切酶消化載體,所述載體選自,所述載體選自(i)環(huán)形多核苷酸組成的載體,所述多核苷酸以5’至3’的方向包含限制性酶切位點 RA、限制性酶切位點RY、限制性酶切位點RZ、可退火接頭序列LB、和限制性酶切位點RB ;( )環(huán)形多核苷酸組成的載體,所述多核苷酸以5’至3’的方向包含限制性酶切位點RA、可退火接頭序列LA、限制性酶切位點RY、限制性酶切位點RZ、和限制性酶切位點RB ;(iii)環(huán)形多核苷酸組成的載體,所述多核苷酸以5’至3’的方向包含限制性酶切位點RA、引物結(jié)合片段PA、限制性酶切位點RY、限制性酶切位點RZ、可退火接頭序列LB、和限制性酶切位點RB ;(iv)環(huán)形多核苷酸組成的載體,所述多核苷酸以5’至3’的方向包含限制性酶切位點RA、可退火接頭序列LA、限制性酶切位點RY、限制性酶切位點RZ、可退火接頭序列LB、和限制性酶切位點RB ;和(ν)環(huán)形多核苷酸組成的載體,所述多核苷酸以5’至3’的方向包含限制性酶切位點 RA、可退火接頭序列LA、限制性酶切位點RY、限制性酶切位點RZ、引物結(jié)合位點ΡΒ、和限制性酶切位點RB ;其中所述消化產(chǎn)生線形化載體; 禾口(b)使所述線形化載體在連接酶存在下接觸線形DNA片段D,其中所述接觸產(chǎn)生包含 DNA片段D的環(huán)形載體,其中限制性酶切位點RA和RB分別可以被IIS型限制性內(nèi)切酶切斷。
100.一種制備載體的方法,該方法包含(a)用一種或多種能夠切斷限制性酶切位點RY和RZ的限制性內(nèi)切酶消化由環(huán)形多核苷酸組成的載體,該多核苷酸以5’至3’的方向包含限制性酶切位點RA、限制性酶切位點 RY、限制性酶切位點RZ、和限制性酶切位點RB,其中所述消化產(chǎn)生線形化載體;和(b)使所述線形化載體在連接酶存在下接觸線形多核苷酸,所述線形多核苷酸選自 (i)線形多核苷酸,以5’至3’的方向包含DNA片段D、和可退火接頭序列LB ;(ii)線形多核苷酸,以5’至3’的方向包含可退火接頭序列LAjnDNA片段;(iii)線形多核苷酸,以5’至3’的方向包含引物結(jié)合片段PA、DNA片段D、和可退火接頭序列LB ;(iv)線形多核苷酸,以5’至3’的方向包含可退火接頭序列LA、DNA片段D、和可退火接頭序列LB ;和(ν)線形多核苷酸,以5’至3’的方向包含可退火接頭序列LA、DNA片段D、和引物結(jié)合片段PB;其中所述接觸產(chǎn)生包含DNA片段D的環(huán)形載體,其中限制性酶切位點RA和RB分別可以被IIS型限制性內(nèi)切酶切斷。
101.權(quán)利要求99或100的方法,其中每個可退火接頭序列獨立地是至少M個核苷酸長,并具有至少60°C的解鏈溫度。
102.權(quán)利要求99或100的方法,其中每個可退火接頭序列獨立地具有至少70%的G-C 含量和至少70°C的解鏈溫度。
103.權(quán)利要求99或100的方法,其中每個可退火接頭序列獨立地具有至少30%的A-T 含量和至少65°C的解鏈溫度,并包含基序5,ANNNNNNNNANNNAANTANNTTNANA-3,,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
104.權(quán)利要求99或100的方法,其中可退火接頭序列LA和/或可退火接頭序列LB選自由SEQ ID NO 1-23或其互補物組成的組。
105.權(quán)利要求99或100的方法,其中引物結(jié)合片段PA和/或PB選自由SEQIDNO 24-25或其互補物組成的組。
106.權(quán)利要求99或100的方法,其中限制性酶切位點RA和RB可以被相同的IIS型限制性內(nèi)切酶切斷。
107.權(quán)利要求99或100的方法,其中限制性酶切位點RA和RB可以被SapI或LguI限制性內(nèi)切酶切斷。
108.權(quán)利要求99或100的方法,其中限制性酶切位點RY和RZ可以被相同的限制性內(nèi)切酶切斷。
109.權(quán)利要求99或100的方法,其中限制性酶切位點RY和RZ可以被IIS型限制性內(nèi)切酶切斷。
110.權(quán)利要求99或100的方法,其中限制性酶切位點RY和RZ可以被khl切斷。
全文摘要
本發(fā)明提供組合物和從大量組分多核苷酸快速裝配為一個或多個裝配好的多核苷酸的方法。本發(fā)明的方法使用環(huán)形核酸載體,所述載體包含DNA片段D,側(cè)鄰于可退火接頭序列、可退火接頭序列對LA和LB、或可退火接頭序列/引物結(jié)合片段對LA和PB或PA和LB。限制性內(nèi)切酶消化包含用于裝配的DNA片段的大量載體以產(chǎn)生大量DNA片段,包括元件PA-D-LB、LA-D-LB、和LA-D-PB,或D-LB、LA-D-LB、和LA-D??赏嘶鸾宇^序列LA和LB提供了DNA片段的互補末端,其用于宿主細(xì)胞介導(dǎo)的同源重組或同時在聚合酶循環(huán)裝配反應(yīng)中與引物結(jié)合片段PA和PB反應(yīng),從而使多種DNA片段有序裝配成為一個或多個裝配好的多核苷酸。
文檔編號C12N15/06GK102282255SQ200980154897
公開日2011年12月14日 申請日期2009年11月19日 優(yōu)先權(quán)日2008年11月19日
發(fā)明者埃里克·杰迪戴亞·迪安, 扎克·塞貝, 杰弗里·A·尤伯薩克斯, 肯尼思·俊樹·竹岡, 蘇尼爾·S·錢德蘭, ·普拉特 達(dá)倫·M, 雷蒙德·洛 申請人:阿邁瑞斯公司