專(zhuān)利名稱(chēng):用于產(chǎn)生高多樣性文庫(kù)的方法
背景技術(shù):
本發(fā)明總體上涉及到產(chǎn)生和變換重組文庫(kù)的方法。
分離一個(gè)目的核酸或氨基酸序列需要一個(gè)數(shù)量龐大的高多樣性重組文庫(kù),該庫(kù)可代表一個(gè)特定的類(lèi)型,并可用一種或多種檢測(cè)技術(shù)鑒定出該種類(lèi)。這樣的文庫(kù)有助于分離出有用的化合物和其編碼序列,這些化合物包括治療劑、研究診斷劑和農(nóng)用試劑。
另外,目的文庫(kù)可專(zhuān)門(mén)設(shè)計(jì)成包含某一化合物的數(shù)目眾多的可能的變體。此類(lèi)文庫(kù)可用于檢測(cè)化合物的改進(jìn)型,例如檢出一具最佳療效的化合物。
增加文庫(kù)多樣性的方法對(duì)于這些或其它應(yīng)用十分有益,它代表了蛋白設(shè)計(jì)產(chǎn)業(yè)的一個(gè)重要焦點(diǎn)。
發(fā)明概要本發(fā)明總體上的特點(diǎn)在于一種生成核酸文庫(kù)的方法,該方法包括(a)產(chǎn)生一批單鏈核酸模板,每個(gè)模板包括一編碼序列和一可操作地連接的啟動(dòng)子序列;(b)用同所述模板基本互補(bǔ)的單鏈核酸片段混合物與所述模板群雜交,這些片段短于模板;(c)讓步驟(b)的每一種雜交體產(chǎn)物與缺失鏈置換活性的DNA聚合酶和DNA連接酶接觸,以這些片段為引物合成基本同模板互補(bǔ)的第二條核酸鏈;和(d)讓步驟(c)的產(chǎn)物與RNA聚合酶接觸,以產(chǎn)生RNA文庫(kù),該庫(kù)由第二條鏈轉(zhuǎn)錄而成。
在優(yōu)選的方案中,將該方法用于向文庫(kù)引入一個(gè)或多個(gè)突變;通過(guò)切割雙鏈核酸分子產(chǎn)生基本互補(bǔ)的單鏈核酸片段混合物;通過(guò)合成隨機(jī)寡核苷酸產(chǎn)生基本互補(bǔ)的單鏈核酸片段混合物;單鏈核酸模板來(lái)自攜帶核酸的M13噬菌體,通過(guò)基因Ⅵ外切酶或λ外切酶消化雙鏈中的一條,通過(guò)鏈親合素結(jié)合生物素化的單鏈核酸,或通過(guò)對(duì)RNA反轉(zhuǎn)錄而獲得;基本互補(bǔ)的單鏈核酸片段混合物至少包括100個(gè)不同種類(lèi)的片段;步驟(b)在每單鏈模板用1到約1000個(gè)片段條件下進(jìn)行,用步驟(c)產(chǎn)物的一條鏈作模板,并對(duì)步驟(b)和(c)進(jìn)行重復(fù);在每一輪中,用步驟(c)的產(chǎn)物作核酸模板重復(fù)步驟(b)和(c);該方法進(jìn)一步涉及一個(gè)或多個(gè)單鏈核酸的片段,它們同單鏈核酸模板形成同源雙螺旋,步驟(b)在可形成同源雙螺旋片段存在的情況下進(jìn)行;啟動(dòng)子為T(mén)7啟動(dòng)子;DNA聚合酶是T4DNA聚合酶;本方法還涉及在接觸步驟(d)之前對(duì)步驟(c)產(chǎn)物進(jìn)行擴(kuò)增;本方法還涉及到步驟(e)將RNA文庫(kù)翻譯成為蛋白質(zhì)文庫(kù);該方法還涉及到步驟(e)將一氨基酸受體分子連接到基本上每一RNA庫(kù)成員的編碼序列的3′端;本方法還涉及步驟(f)翻譯RNA文庫(kù)而產(chǎn)生一個(gè)RNA-蛋白質(zhì)融合文庫(kù)。
在第二個(gè)方面,本發(fā)明的特點(diǎn)還在于一種減少一群核酸分子中序列的變異的方法。該方法包括(a)產(chǎn)生第一群具變化的序列的單鏈核酸模板,基本上每一模板包括一編碼序列和一可操作地連接的啟動(dòng)子序列;(b)用基本同第一群模板互補(bǔ)的第二群?jiǎn)捂満怂崞闻c第一群雜交,這些片段均短于模板且屬于基本上相同的序列;(c)令步驟(b)的雜交產(chǎn)物同缺乏鏈置換活性的DNA聚合酶和DNA連接酶相接觸,以這些片段為引物合成基本與模板互補(bǔ)的第二核酸鏈;和(d)令步驟(c)的產(chǎn)物同RNA聚合酶相接觸以產(chǎn)生一群RNA分子,這些RNA分子由第二條核酸鏈轉(zhuǎn)錄而成,且相對(duì)于第一群?jiǎn)捂満怂崮0逍蛄凶儺悳p少。
在優(yōu)選方案中,本方法被用于從第一組單鏈核酸模板中去除一個(gè)或多個(gè)突變;步驟(b)涉及到用兩群或更多群不同的基本互補(bǔ)單鏈片斷同第一群?jiǎn)捂溎0暹M(jìn)行雜交;通過(guò)切開(kāi)雙鏈核酸分子產(chǎn)生第二群基本互補(bǔ)的核酸片段;通過(guò)合成隨機(jī)寡核苷酸來(lái)產(chǎn)生第二群基本互補(bǔ)的核酸片段;單鏈核酸模板產(chǎn)自攜帶該核酸的M13噬菌體,或用基因Ⅵ外切酶或λ外切酶降消化雙鏈核酸中的一條,或用鏈親合素俘獲生物素化的單核酸鏈,或通過(guò)反轉(zhuǎn)錄RNA來(lái)獲得。步驟(b)在每個(gè)單鏈模板用1到約1000單鏈核酸片段的條件下進(jìn)行;步驟(c)產(chǎn)物的單鏈被用作模板,并對(duì)步驟(b)和(c)進(jìn)行重復(fù);在每一輪中,用步驟(c)的產(chǎn)物作核酸模板重復(fù)步驟(b)和(c);啟動(dòng)子為T(mén)7啟動(dòng)子;DNA聚合酶為T(mén)4DNA聚合酶;本方法還涉及在接觸步驟(d)之前對(duì)核酸步驟(c)產(chǎn)物進(jìn)行擴(kuò)增;本方法還涉及步驟(e)將RNA文庫(kù)翻譯成為蛋白質(zhì)文庫(kù);該方法還涉及到步驟(e)將一氨基酸受體分子連接到RNA庫(kù)基本上每一成員的編碼序列的3′端;本方法進(jìn)一步涉及步驟(f)翻譯該群RNA分子而產(chǎn)生一個(gè)RNA-蛋白質(zhì)融合文庫(kù)。
在第三個(gè)方面,本發(fā)明的特點(diǎn)還在于一種產(chǎn)生核酸文庫(kù)的方法,該方法包括(a)產(chǎn)生一群?jiǎn)捂満怂崮0?,每模板包括一編碼序列;(b)產(chǎn)生一群具有不同序列的單鏈核酸分子,它們同單鏈模板基本互補(bǔ);(c)在足以形成雙聚體的情況下,令這些具有不同序列的單鏈核酸分子同單鏈核酸模板群雜交;和(d)讓雙螺旋與一種或多種切割/修復(fù)酶接觸,在可令這些酶修復(fù)雙螺旋中錯(cuò)配堿基對(duì)的條件下作用。
在一優(yōu)選方案中,本方法進(jìn)一步涉及到產(chǎn)生一群來(lái)自步驟(d)產(chǎn)物的單鏈模板并重復(fù)步驟(c)和(d);在每一輪中,用步驟(d)產(chǎn)物作單鏈模板重復(fù)步驟(c)和(d)。
在第四個(gè)方面,本發(fā)明的特點(diǎn)還在于產(chǎn)生了一種產(chǎn)核酸文庫(kù)的方法,該方法包括(a)產(chǎn)生一群?jiǎn)捂満怂崮0澹磕0灏ㄒ痪幋a序列;(b)利用同單鏈核酸模板基本互補(bǔ)的核酸片段混合物與這一群?jiǎn)捂満怂崮0咫s交,這些片段的長(zhǎng)度短于模板;(c)令步驟(b)的每一種雜交產(chǎn)物與缺乏鏈置換活性的DNA聚合酶及DNA連接酶相接觸,以片段為引物來(lái)合成同核酸模板基本互補(bǔ)的第二核酸鏈;(d)以一種或多種切割/修復(fù)酶作用于步驟(c)的產(chǎn)物,作用在可使這些酶修復(fù)產(chǎn)物中的錯(cuò)配堿基的條件下進(jìn)行。
在優(yōu)選方案中,本方法還涉及產(chǎn)生一群來(lái)自于步驟(d)的單鏈模板并對(duì)步驟(b)-(d)進(jìn)行重復(fù);重復(fù)(b)-(d)時(shí),每一輪使用來(lái)自于步驟(d)的產(chǎn)物的一群?jiǎn)捂溎0濉?br>
在本發(fā)明第三和第四方面的優(yōu)選方案中,與切割/修復(fù)酶的接觸在生物體內(nèi)完成(如在細(xì)菌細(xì)胞中);與切割/修復(fù)酶的接觸在體外完成;單鏈核酸模板產(chǎn)自攜帶該核酸的M13噬菌體,或用基因Ⅵ外切酶或λ外切酶消化雙鏈核酸模板的一條鏈,或用鏈親合素俘獲生物素化的單核酸鏈或反轉(zhuǎn)錄RNA來(lái)獲得。步驟(b)每個(gè)單鏈核酸模板使用1到約1000具有不同序列的單鏈核酸分子或單鏈核酸片段的條件下進(jìn)行;本方法進(jìn)一步涉及步驟(e)擴(kuò)增步驟(d)的產(chǎn)物;每一編碼序列均與啟動(dòng)子序列可操作地連接;本方法還進(jìn)一步涉及步驟(e)將步驟(d)的產(chǎn)物轉(zhuǎn)錄以產(chǎn)生一RNA文庫(kù);本方法還進(jìn)一步涉及步驟(f)翻譯該RNA文庫(kù)以產(chǎn)生一蛋白質(zhì)文庫(kù);本方法還涉及步驟(f)將一氨基酸受體分子連接于RNA文庫(kù)基本上每一成員的編碼序列的3′末端;本方法進(jìn)一步涉及步驟(g)翻譯該RNA文庫(kù)以產(chǎn)生一RNA-蛋白質(zhì)融合文庫(kù)。
在這里使用的“文庫(kù)”指的至少108個(gè)含核酸和/或氨基酸組分的分子,優(yōu)選為至少1010個(gè),更優(yōu)選至少1012個(gè);最優(yōu)選為至少1014個(gè)分子。
核酸片段“混合物”指至少100個(gè)核酸片段,優(yōu)選為至少500個(gè),更優(yōu)選為至少1000個(gè),最優(yōu)選為至少1500個(gè)片段。
“啟動(dòng)子序列”指的是具有有功能的RNA聚合酶結(jié)合位點(diǎn)并能使鄰近的編碼序列轉(zhuǎn)錄的任何核酸序列。
“基本互補(bǔ)”指一條核酸鏈具有足量的可以同另一核酸鏈形成沃森-克里克堿基對(duì)的核苷酸而在兩種核酸之間產(chǎn)生一個(gè)或多個(gè)雙鏈區(qū)域??梢哉J(rèn)為不需要一個(gè)核酸分子中的每一核苷酸均與另一基本互補(bǔ)的反向鏈中的核苷酸形成沃森-克里克堿基對(duì);同時(shí),在“基本互補(bǔ)的單鏈核酸混合物中”,相當(dāng)一部分片段包含有一個(gè)或多個(gè)可與“單鏈核酸模板”形成錯(cuò)配的核苷酸。
“鏈置換活性”指的是聚合酶或與其相關(guān)的解旋酶打斷兩個(gè)核酸鏈之間堿基配對(duì)的能力。
“突變”指的是任何核苷酸的變化,它包括可引起不同表型的序列變化或沉默變化。
“雙螺旋”指的是兩條核酸鏈具備的互補(bǔ)序列足以維持雜交體的情況下退火形成的結(jié)構(gòu)。一個(gè)雙螺旋可是“同源雙螺旋”或“異源雙螺旋”?!巴措p螺旋中”,一條鏈的所有核苷酸均與另一條反向中核苷酸形成配對(duì)?!爱愒措p螺旋”指兩條核酸分子中,由于一個(gè)或多個(gè)錯(cuò)配,一條鏈中的一個(gè)或多個(gè)核苷酸沒(méi)有或不能同另一條中的一個(gè)或多個(gè)核苷酸形成適當(dāng)配對(duì),在這種情況下退火形成的結(jié)構(gòu)。不同類(lèi)型的異源雙螺旋的例子包括表現(xiàn)出一個(gè)或多個(gè)核苷酸交換或插入與缺失突變的雙螺旋。
“隨機(jī)寡核苷酸”指的是一些寡核苷酸混合物,它們?cè)谝粋€(gè)或多個(gè)核苷酸位置上有變動(dòng)。隨機(jī)寡核苷酸可通過(guò)完全或部分隨機(jī)合成的方法產(chǎn)生,也可以直接方式有目的地變動(dòng)某個(gè)核苷酸。
“氨基酸受體分子”指的是任一可通過(guò)核糖體肽酰轉(zhuǎn)移酶催化而摻入生長(zhǎng)中的蛋白鏈C端的分子。典型的“氨基酸受體分子”包括(ⅰ)一個(gè)核苷或核苷樣部分(如腺苷或腺苷類(lèi)似物(可以在N-6氨基位二甲基化)),(ⅱ)一個(gè)氨基酸或氨基酸樣部分(如20個(gè)D或L-氨基酸中的任何一個(gè)或其類(lèi)似物(如O-甲基-酪氨酸或在Ellman etal.,Meth.Enzymol.202:301,1991述及的任何氨基酸類(lèi)似物)),和(ⅲ)兩者之間的連接(如在3′位置上的酯、酰胺或酮連接物,2′位置亦可,但不如3′);優(yōu)選的這一連接不要明顯地干擾天然核糖核苷構(gòu)型中的環(huán)的折疊。氨基酸受體可以具有一個(gè)親核體,這可以是一個(gè)氨基基團(tuán)、羥基基團(tuán)或疏基基團(tuán),但不限于此。另外,氨基酸受體可以包括核苷類(lèi)似物、氨基酸類(lèi)似物或一具核苷-氨基酸復(fù)合結(jié)構(gòu)的類(lèi)似物。
將氨基酸受體分子連至編碼序列的“3′端”意指將氨基酸受體分子置于編碼序列的最后一個(gè)密碼子之后。這一術(shù)語(yǔ)包括,但不限于恰好位于編碼序列3′端的氨基酸受體分子,同時(shí)也包括該分子同最后一個(gè)密碼子相隔一段間插的編碼或非編碼序列(如,一段與暫停位點(diǎn)相關(guān)的序列)的情況。該術(shù)語(yǔ)還包括這樣的結(jié)構(gòu)其中,編碼或非編碼序列位于氨基酸受體分子之后(即3′末端)。同時(shí),本術(shù)語(yǔ)還包括,但不限于這樣的情況,一個(gè)氨基酸受體分子與編碼序列共價(jià)相連(直接或通過(guò)核酸間隔序列間接相連),也包括通過(guò)某些非共價(jià)鏈相連的情況,如同一連有氨基酸受體的核酸鏈與編碼鏈3′端附近雜交。
“RNA-蛋白”融合意指任何包含有通過(guò)酰胺鍵與蛋白共價(jià)結(jié)合的核糖核酸的分子。該共價(jià)鍵抗核糖體裂解。
“蛋白質(zhì)”指的是兩個(gè)或兩個(gè)以上天然生成或修飾過(guò)的氨基酸以一個(gè)或多個(gè)肽鍵相連的分子。“蛋白”、“肽”和“多肽”在這里是可交換使用的。
“一群具變化序列的單鏈模板”意指具有只有一個(gè)或幾個(gè)核苷位點(diǎn)不同的序列的一群核酸。
“切割/修復(fù)酶”指的是可以去除錯(cuò)配堿基或環(huán)并代之以標(biāo)準(zhǔn)堿基對(duì)(即A∶T或G∶C)的酶的任意組合。
附圖簡(jiǎn)述
圖1是一種產(chǎn)生高多樣性RNA-蛋白質(zhì)融合文庫(kù)的典型片段重組方法的圖解。該方法中的片段來(lái)自已引入序列變異的雙鏈DNA分子。
圖2是第二種典型片段重組方法的起始步驟的圖解。該方法中的片段是已引入序列變異的合成寡核苷酸。
詳述本發(fā)明涉及到很多新的用于核酸序列隨機(jī)重組、產(chǎn)生具遺傳變異的DNA、RNA和蛋白質(zhì)文庫(kù)的相關(guān)方法。如下文的詳述,在一種優(yōu)選方案中,這一技術(shù)在體外進(jìn)行以產(chǎn)生傳統(tǒng)的蛋白質(zhì)文庫(kù)或RNA-蛋白質(zhì)融合文庫(kù),這兩者均可用于與用于從文庫(kù)群中選擇目的蛋白或多肽(或它們的相關(guān)編碼序列)的多種方法的任一種結(jié)合使用。這一通用的方法提供了一種以非偏倚的方式向蛋白質(zhì)文庫(kù)引入突變的手段,以及一種從文庫(kù)或選定的庫(kù)中除去非所需突變的技術(shù),還可在其后的選擇中“回交”出一組分子。
片段重組根據(jù)本發(fā)明的一種優(yōu)選方法,可通過(guò)產(chǎn)生突變片段并用其同未突變片段(一般為野生型)進(jìn)行隨機(jī)重組以產(chǎn)生文庫(kù)。這一通用方法的一個(gè)例子可見(jiàn)圖1。如圖所示,突變首先被隨機(jī)引入一初始雙鏈DNA序列(稱(chēng)“dsDNA(init)”)。這產(chǎn)生了一群突變的雙鏈DNA序列,圖1中稱(chēng)為“dsDNA(mut)”??赏ㄟ^(guò)任何手段引入這些突變,包括PCR突變法(該方法依賴(lài)于Taq聚合酶的錯(cuò)配修復(fù)能力低的機(jī)制),位點(diǎn)特異突變或模板特異突變(例見(jiàn)Joyce and Inoue,Nucl.Acids Res.,17:177,1989)。這一群包含突變的DNA隨之用多種標(biāo)準(zhǔn)方法切成片段。例如,用一種或幾種核酸酶部分降解DNA(如DNaseI,微球核酸酶,限制性?xún)?nèi)切酶或P1核酸酶),或可進(jìn)行化學(xué)降解,如利用Fe·EDTA.另外,還可通過(guò)在多聚化(如PCR擴(kuò)增)時(shí)限制核苷的消耗來(lái)產(chǎn)生包含有突變的片段,或進(jìn)行簡(jiǎn)單的物理切割(如超聲處理)。較理想的片段長(zhǎng)約25-1000個(gè)堿基對(duì),最理想的長(zhǎng)50-150個(gè)堿基對(duì)。
隨后,加熱這些DNA片段,然后將之同已確認(rèn)為初始DNA非編碼鏈(或稱(chēng)負(fù)鏈)的全長(zhǎng)單鏈DNA模板一起退火。另外,這一雜交混合物中還包括另一種片段,有時(shí)稱(chēng)之為“終止子片段”(Joyce andInoue,Nucl.Acids Res.17:171,1989)。這一終止片段與單鏈模板的3′端互補(bǔ)并提供一個(gè)聚合反應(yīng)的引物,它與模板的結(jié)合不依賴(lài)于隨機(jī)退火的突變片段的數(shù)量和性質(zhì)。
單鏈模板可通過(guò)任何標(biāo)準(zhǔn)技術(shù)生成,如利用攜帶DNA序列的M13噬菌體,或利用基因Ⅵ核酸外切酶(Nikiforov et a1,PCR MethodAppl.3:285,1994)或λ核酸外切酶(Higuchi and Ochman,Nucl.AcidsRes17:5865,1989)降解dsDNA(init)分子的編碼鏈,或通過(guò)固定化的鏈親合素俘獲生物素化的DNA鏈(Joyce and Inoue,Nucl.AcidsRes.17:171,1989),或通過(guò)對(duì)RNA進(jìn)行反轉(zhuǎn)錄。將模板同片段相混合以進(jìn)行雜交,混合比例不得低于每模板分子一個(gè)片段,不得高于每模板分子1000個(gè)片段。片段同模板的比較例較低時(shí)產(chǎn)生的子代鏈更接近于模板,比例較高時(shí)則更接近于片段??赏ㄟ^(guò)標(biāo)準(zhǔn)方法來(lái)確定雜交條件,并被設(shè)計(jì)成能形成模板與片段的異源雙螺旋。雜交技術(shù)的示例可見(jiàn)于stemmer.美國(guó)專(zhuān)利No.5,605,793。
片段在與模板退火后,用缺乏鏈置換活性的DNA聚合酶和DNA連接酶將其連接起來(lái)。適用于該目的的DNA聚合酶包括T4DNA聚合酶和來(lái)自大腸桿菌的重組DNA polⅡ(例見(jiàn)Hughes et al.,J.Biol Chem.266:4568,1991),但不限于以上兩種。任何DNA連接酶(如T4DNA連接酶)均可使用。在這一步,可先用DNA聚合酶后用DNA連接酶處理于DNA雙螺旋,也可同時(shí)使用這兩種酶,例見(jiàn)Joyce和Inove(Nucl.AcidsRes17:711,1989)。如圖1所示,本步生成一群雙鏈DNA(稱(chēng)為“dsDNA(lib)”),其中每一成員基本都在一條鏈上有1到多個(gè)引入的突變。由于最初引入的突變和退火的片段數(shù)量和性質(zhì)都是隨機(jī)的,該群DNA中不同的雙螺旋具有不同的突變序列。
這一用于生成雙鏈DNA文庫(kù)的通用方法有一個(gè)替代方法,可見(jiàn)圖2。此替代方法中,一些單鏈寡核苷酸片段被合成出來(lái),它們同初始雙鏈DNA分子的編碼鏈部分相對(duì)應(yīng)。這些寡核苷酸片段以長(zhǎng)5-2000個(gè)核苷酸為宜,最適長(zhǎng)度為20-100個(gè)核苷酸,并以標(biāo)準(zhǔn)的核酸合成方法來(lái)產(chǎn)生。這些帶有隨機(jī)或半隨機(jī)突變的寡核苷酸可通過(guò)標(biāo)準(zhǔn)方法來(lái)合成。這些寡核苷酸優(yōu)選每20個(gè)核苷酸有3個(gè)以?xún)?nèi)的引入錯(cuò)配,同時(shí)應(yīng)避免讀碼框內(nèi)的終止密碼子。另外。在某些情況下,還可通過(guò)引入非天然的強(qiáng)親合性堿基對(duì),如C-5丙炔尿嘧啶或C-5-丙炔胞嘧啶,以增強(qiáng)寡核苷酸的雜交能力,這是有益甚至是必需的。這些技術(shù)可見(jiàn)于Wagneret al,Science260:1510,1993。
隨后,用這些含有突變的寡核苷酸片段同單鏈模板雜交,這些模板同上一方法一樣是全長(zhǎng)的,其序列與初始DNA的非編碼鏈(負(fù)鏈)一致。同上文所述,片段用DNA聚合酶和DNA連接酶來(lái)連接以產(chǎn)生雙鏈DNA文庫(kù)(dsDNA(lib))。這一文庫(kù)也包括一群雙螺旋分子,其中有一組不同的編碼鏈,它們的區(qū)別在于突變的數(shù)量、位置和同一性。
如果需要,以上步驟均可利用片段或寡核苷途徑進(jìn)行重復(fù)以向DNA分子引入不同數(shù)量的突變。具體地講,可以突變鏈為初始單鏈模板,用突變片段或寡核苷酸與這些鏈退火并進(jìn)行多聚化和連接。
回交方法如上文概述,本發(fā)明的方法被用于向一初始DNA序列引入突變。另外,這些技術(shù)可用于除去或減少DNA文庫(kù)中的不需要的突變發(fā)生的頻率,根據(jù)這一方法,dsDNA(mut)在被切成片段后同野生型序列的寡核苷酸或同未突變或野生型的DNA(wtDNA)的特定片段一起加入到單鏈模板中。這些片段是相互分離的鏈(如必需),將其同全長(zhǎng)單鏈一起退火,再如上文用DNA聚合酶或T4連接酶將之連接。相對(duì)相應(yīng)的突變片段而言,使用高濃度的未突變寡核苷酸或片段所產(chǎn)生的文庫(kù)中,不需要的突變被降至最少甚至消除。
此方法還可用于現(xiàn)有的含有在突變的文庫(kù),以同樣減少或除去不需要的序列。該方法涉及到一具有突變序列的初始文庫(kù)以及野生序列的片段或寡核苷酸的退火、多聚化和連接,操作同上文所述。
RNA、蛋白質(zhì)或RNA-蛋白質(zhì)文庫(kù)在本發(fā)明的一個(gè)優(yōu)選方案中,上文述及的DNA文庫(kù)還進(jìn)一步包括RNA聚合酶如SPb或T7聚合酶的結(jié)合位點(diǎn)。這些位點(diǎn)例見(jiàn)Milligan etal.,Proc.Natl.Acad.Sci.USA87:696,1990。該位點(diǎn)位于編碼序列的上游,這一位置使序列得以轉(zhuǎn)錄。一般此類(lèi)位點(diǎn)位于編碼序列上游5-2000個(gè)堿基對(duì)處。
包含有RNA聚合酶結(jié)合位點(diǎn)的文庫(kù)可通過(guò)上文提及的方法予以變動(dòng)。多聚化和連接之后,可直接轉(zhuǎn)錄dsDNA(lib)以產(chǎn)生RNA文庫(kù),如利用體外轉(zhuǎn)錄系統(tǒng),還可將dsDNA(lib)直接轉(zhuǎn)錄并翻譯以產(chǎn)生蛋白質(zhì)文庫(kù),如利用體外轉(zhuǎn)錄和翻譯系統(tǒng)。體外轉(zhuǎn)錄和體外翻譯系統(tǒng)的例子包括T7轉(zhuǎn)錄系統(tǒng)和兔網(wǎng)織紅細(xì)胞、麥胚芽、酵母及大腸桿菌翻譯系統(tǒng)。
如果需要,可通過(guò)在轉(zhuǎn)錄前進(jìn)行鏈特異性擴(kuò)增來(lái)增加文庫(kù)中每一RNA或蛋白的拷貝數(shù)。例如,PCR擴(kuò)增可通過(guò)在多聚化和連接步驟中向突變鏈引入統(tǒng)一的引物結(jié)合序列以同引物結(jié)合。這些序列可作為錯(cuò)配或DNA一端或兩端的延伸而并入。這可使新生鏈擴(kuò)增時(shí)不擴(kuò)增模板鏈。還可以通過(guò)對(duì)與新生鏈3′端互補(bǔ)的單一寡核苷酸引物進(jìn)行多輪的退火和延伸以進(jìn)行線(xiàn)性擴(kuò)增。隨后的PCR和轉(zhuǎn)錄過(guò)程產(chǎn)生的RNA主要對(duì)應(yīng)于突變序列,只有一小部分由模板序列產(chǎn)生。
在一個(gè)優(yōu)選方案中,上述用于引入突變或回交去除不需要的突變的方法可被用于產(chǎn)生高多樣性的RNA-蛋白質(zhì)文庫(kù)。該文庫(kù)的建立可通過(guò)將一個(gè)包含有不水解的氨基酸受體分子如嘌呤霉素的接頭連至文庫(kù)(如,按上文方法創(chuàng)建的文庫(kù))的RNA3′端來(lái)完成。產(chǎn)生RNA-蛋白質(zhì)融合文庫(kù)的例子可見(jiàn)于Szostak et al.,USSN09/007,005;及Robertset al.,Proc.Natl.Acad.Sci.USA94:12297,1997。隨后對(duì)這些RNA的翻譯產(chǎn)生了一個(gè)RNA蛋白融合分子庫(kù),它可用于體外選擇實(shí)驗(yàn)。
此外,如果需要,RNA或RNA-蛋白融合分子經(jīng)選擇后可用作標(biāo)準(zhǔn)PCR的模板以獲得相關(guān)編碼序列。這樣,本方法就提供了一個(gè)可用于片段重組、分子回交、蛋白和/多肽選擇和其相關(guān)編碼序列選擇的手段,這些均在體外系統(tǒng)完成。
切割/修復(fù)除片段重組方法之外,切割/修復(fù)也可用于變動(dòng)庫(kù)中的序列。這一方法可用于產(chǎn)生DNA、RNA和RNA-蛋白質(zhì)融合文庫(kù)。該技術(shù)的依據(jù)在于按上文任一種方法產(chǎn)生的dsDNA(lib)自身帶有特定數(shù)量的錯(cuò)配堿基對(duì)。為產(chǎn)生文庫(kù)序列的多樣性,這些錯(cuò)配需在體外用切割/修復(fù)酶加以修復(fù)??衫萌我磺懈?修復(fù)系統(tǒng)來(lái)進(jìn)行修復(fù)(例見(jiàn)Jaiwal et al.,Nucl.Acids Res.26:2l84,1998;或Fortini et al.,Biochemistry37:3575,1998)。
切割/修復(fù)步驟還可通過(guò)將dsDNA(lib)轉(zhuǎn)入細(xì)菌或酶母菌株以利用它們的修復(fù)系統(tǒng)在體內(nèi)來(lái)完成。該步驟也可通過(guò)將文庫(kù)轉(zhuǎn)化入一標(biāo)準(zhǔn)的體內(nèi)切割/修復(fù)系統(tǒng)來(lái)完成。該系統(tǒng)的例子可見(jiàn)于Campbell etal.,Mutat Res.211:181,1989;Bishop and kolodner.Mol.Cell Biol.6:3401,1986;Fishel et al.,J.Mol.Biol188:147,1986;和Westmoreland et.al.,Genetics145:29,1997。
由于以上的修復(fù)過(guò)程是隨機(jī)進(jìn)行的,這一切割/修復(fù)方法有時(shí)可導(dǎo)致突變引入文庫(kù)序列且其它時(shí)候也可能造成編碼鏈回交成野生型序列。
在以上方法的一個(gè)替代方法中,體外或體內(nèi)的切割/修復(fù)可利用dsDNA(mut)(如,按上述方法產(chǎn)生的dsDNA(mut)和dsDNA(init)或wtDNA作為底物來(lái)產(chǎn)生多樣性文庫(kù)。在該技術(shù)中,混合物的鏈被分開(kāi)并重新退火,然后在體外與切割/修復(fù)酶共溫浴或轉(zhuǎn)化入細(xì)菌以利用細(xì)菌的切割/修復(fù)系統(tǒng)(如上文提及的系統(tǒng))??梢栽摲椒▽⑼蛔冸S機(jī)引入序列,也可將野生序列回交到dsDNA(mut)分子中。
權(quán)利要求
1.用于生成核酸文庫(kù)的方法,該方法包括(a)產(chǎn)生一群?jiǎn)捂満怂崮0?,每個(gè)模板包括一編碼序列和一可操作地連接的啟動(dòng)子序列;(b)用同所述模板基本互補(bǔ)的單鏈核酸片段混合物與所述模板群雜交,這些片段短于所述核酸模板;(c)讓步驟(b)的每一種雜交產(chǎn)物與缺乏鏈置換活性的DNA聚合酶和DNA連接酶相接觸,以這些片段為引物合成基本同模板互補(bǔ)的第二條核酸鏈;和(d)讓步驟(c)的產(chǎn)物與RNA聚合酶接觸以產(chǎn)生RNA文庫(kù),該文庫(kù)由第二條核酸鏈轉(zhuǎn)錄而成。
2.權(quán)利要求1的方法,其中,所述方法的方法應(yīng)用于向該文庫(kù)中引入一個(gè)或多個(gè)突變。
3.用于減少一群核酸分子中的序列變異的方法,該方法包括(a)產(chǎn)生第一群具變化的序列的單鏈核酸模板,基本上每一模板包括一編碼序列和一可操作連接啟動(dòng)子序列;(b)用基本同單鏈核酸模板互補(bǔ)的第二群?jiǎn)捂満怂崞闻c第一群雜交,這些片段均短于所述核酸模板并基本屬于同一序列;(c)令步驟(b)的雜交產(chǎn)物同缺乏鏈置換活性的DNA聚合酶和DNA連接酶接觸,以這些片段為引物合成基本與核酸模板互補(bǔ)的第二鏈;(d)令步驟(c)的產(chǎn)物同RNA聚合酶相作用以產(chǎn)生一群RNA分子,這些RNA分子由第二條鏈轉(zhuǎn)錄而成,且相對(duì)于第一群?jiǎn)捂満怂崮0遄儺愝^小。
4.權(quán)利要求3的方法,其中,所述方法應(yīng)用于消除所述的第一群?jiǎn)捂満怂崮0逯械囊粋€(gè)或多個(gè)突變。
5.權(quán)利要求3的方法,其中,步驟(b)包括用第一群?jiǎn)捂満怂崮0逋瑑扇夯蚨嗳夯净パa(bǔ)的單鏈核酸片段進(jìn)行雜交。
6.權(quán)利要求1或3的方法,其中,基本互補(bǔ)的單鏈核酸片段混合物由解開(kāi)雙鏈核酸分子或合成隨機(jī)寡核苷酸而生成。
7.權(quán)利要求1或3的方法,其中,所述的單鏈核酸模板是用攜帶該核酸的M13噬菌體、或用基因Ⅵ外切酶成λ外切酶降解雙鏈核酸模板的一條鏈,或用鏈親合素俘獲生物素化的單鏈核酸,或?qū)NA進(jìn)行反轉(zhuǎn)錄而獲得。
8.權(quán)利要求1或3的方法,其中,所述的基本互補(bǔ)的單鏈核酸片段混合物包括至少約100種不同的核酸片段。
9.權(quán)利要求1或3的方法,其中,步驟(b)在每個(gè)單鏈核酸模板用1到約1000個(gè)片段的條件下進(jìn)行。
10.權(quán)利要求1或3的方法,其中,步驟(c)的單鏈產(chǎn)物被用作核酸模板且步驟(b)和(c)重復(fù)進(jìn)行。
11.權(quán)利要求10的方法,其中,在每一輪中用步驟(c)產(chǎn)物作核酸模板而重復(fù)進(jìn)行所述的(b)和(c)。
12.權(quán)利要求1的方法,其中,所述的方法進(jìn)一步包括產(chǎn)生一個(gè)或多個(gè)單鏈核酸模板,這些模板可與所述的單鏈核酸模板形成同源雙螺旋,同時(shí),步驟(b)在存在可形成同源雙螺旋的片段的情況下進(jìn)行。
13.權(quán)利要求1或3的方法,其中,所述的啟動(dòng)子為T(mén)7啟動(dòng)子。
14.權(quán)利要求1或3的方法,其所述的DNA聚合酶為T(mén)4DNA聚合酶。
15.權(quán)利要求1或3的方法,其中,所述的方法進(jìn)一步包括在接觸步驟(d)之前對(duì)步驟(c)的產(chǎn)物進(jìn)行擴(kuò)增。
16.權(quán)利要求1或3的方法,其中,所述方法進(jìn)一步包括步驟(e)翻譯RNA文庫(kù)以產(chǎn)生蛋白質(zhì)文庫(kù)。
17.權(quán)利要求1或3的方法,其中,所述方法進(jìn)一步包括步驟(e)將所述的RNA文庫(kù)基本上每一成員的編碼序列3′端與一氨基酸受體分子連接。
18.權(quán)利要求17的方法,其中,該方法進(jìn)一步包括步驟(f)翻譯所述的RNA文庫(kù)以產(chǎn)生一個(gè)RNA-蛋白質(zhì)融合文庫(kù)。
19.一種用于產(chǎn)生核酸文庫(kù)的方法,該方法包括(a)產(chǎn)生一群?jiǎn)捂満怂崮0?,每模板包括一編碼序列;(b)產(chǎn)生一群具有不同序列的單鏈核酸分子,它們同所述單鏈核酸模板群基本互補(bǔ);(c)在可充分形成雙螺旋的情況下,令這些具不同序列的單鏈核酸分子同單鏈核酸模板雜交;和(d)讓雙螺旋與一種或多種切割/修復(fù)酶接觸,在可令這些酶修復(fù)雙螺旋中錯(cuò)配堿基的條件下作用。
20.權(quán)利要求19的方法,其中,該方法還包括產(chǎn)生一群來(lái)自于步驟(d)產(chǎn)物的單鏈模板,并重復(fù)步驟(c)和(d)。
21.權(quán)利要求20的方法,其中在每一輪中用步驟(d)的產(chǎn)物作單鏈模板重復(fù)步驟(c)和(d)。
22.用于產(chǎn)生核酸文庫(kù)的方法,該方法包括(a)產(chǎn)生一群?jiǎn)捂満怂崮0澹磕0灏ㄒ痪幋a序列;(b)利用同單鏈核酸模板基本互補(bǔ)的核酸片段混合物與單鏈核酸模板雜交,這些片段長(zhǎng)度短于所述核酸模板;(c)令步驟(b)的雜交產(chǎn)物與缺乏鏈置換活性的DNA聚合酶及DNA連接酶相接觸,以該片段為引物來(lái)合成同該核酸模板基本互補(bǔ)的第二核酸鏈;(d)讓一種或多種切割/修復(fù)接觸步驟(c)的產(chǎn)物,作用在可使這些酶修復(fù)產(chǎn)物中的錯(cuò)配堿基的條件下進(jìn)行。
23.權(quán)利要求22的方法,其中,所述方法進(jìn)一步包括產(chǎn)生來(lái)自步驟(d)產(chǎn)物的一群?jiǎn)捂溎0澹⒅貜?fù)步驟(b)-(d)。
24.權(quán)利要求23的方法,其中,所述在每一輪中,來(lái)自步驟(d)產(chǎn)物的單鏈模板重復(fù)步驟(b)-(d)。
25.權(quán)利要求19或22的方法,其中,與所述切割/修復(fù)酶的接觸在體內(nèi)進(jìn)行。
26.權(quán)利要求25的方法,其中,與所述切割/修復(fù)酶的接觸在細(xì)菌細(xì)胞內(nèi)進(jìn)行。
27.權(quán)利要求19或22的方法,其中,與切割/修復(fù)酶的接觸在體外進(jìn)行。
28.權(quán)利要求19或22的方法,其所述的單鏈核酸模板產(chǎn)自于攜帶該核酸的M13噬菌體,或用基因Ⅵ外切酶或λ外切酶降解雙鏈核酸模板的一條鏈,或用鏈親合素俘獲生物素化的單鏈核酸,或?qū)NA進(jìn)行反轉(zhuǎn)錄而獲得。
29.權(quán)利要求19或22的方法,其中,步驟(b)在每個(gè)單鏈核酸模板使用1-約1000個(gè)含不同序列的單鏈核酸分子或單鏈核酸片段的條件下進(jìn)行。
30.權(quán)利要求19或22的方法,其中,該方法進(jìn)一步包括(e)擴(kuò)增步驟(d)的產(chǎn)物。
31.權(quán)利要求19或22中的方法,其中,每一所述的編碼序列與一啟動(dòng)子可操作地連接。
32.權(quán)利要求31的方法,其中,該方法進(jìn)一步包括(e)轉(zhuǎn)錄步驟(d)的產(chǎn)物以產(chǎn)生一RNA文庫(kù)。
33.權(quán)利要求32的方法,其中,該方法進(jìn)一步包括(f)翻譯該RNA文庫(kù)以產(chǎn)生蛋白質(zhì)文庫(kù)。
34.權(quán)利要求32的方法,其中,該方法進(jìn)一步包括(f)將所述RNA文庫(kù)中基本上每一成員編碼序列的3′端連接上一氨基酸受體分子。
35.權(quán)利要求34的方法,其中,該方法進(jìn)一步包括(g)翻譯該RNA文庫(kù)以產(chǎn)生RNA-蛋白質(zhì)融合文庫(kù)。
全文摘要
本發(fā)明披露了一種產(chǎn)生核酸文庫(kù)的方法,該方法包括:(a)產(chǎn)生一群?jiǎn)捂満怂崮0?每個(gè)模板包括一編碼序列和一可操作地連接的啟動(dòng)子序列;(b)用同所述單鏈核酸模板基本互補(bǔ)的單鏈核酸片段混合物與所述模板群雜交,這些片段短于模板;(c)令步驟(b)的每一種雜交產(chǎn)物同缺乏鏈置換活性的DNA聚合酶和DNA連接酶相接觸,以這些片段為引物合成基本同模板互補(bǔ)的第二條核酸鏈;和(d)讓步驟(c)的產(chǎn)物與RNA聚合酶接觸以產(chǎn)生RNA文庫(kù),該文庫(kù)由第二條鏈轉(zhuǎn)錄而成。
文檔編號(hào)C12P19/34GK1308683SQ99807977
公開(kāi)日2001年8月15日 申請(qǐng)日期1999年6月29日 優(yōu)先權(quán)日1998年6月29日
發(fā)明者R·瓦格納, M·C·賴(lài)特, B·克雷德?tīng)?申請(qǐng)人:菲洛斯公司