亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

cDNA文庫制備的制作方法

文檔序號:432444閱讀:1281來源:國知局

專利名稱::cDNA文庫制備的制作方法cDNA文庫制備發(fā)明領(lǐng)域總的來說,本發(fā)明涉及分子生物學(xué)領(lǐng)域,且具體涉及cDNA和DNA文庫的生成。發(fā)明背景通過測序?qū)D(zhuǎn)錄物進(jìn)行特征分析(profiling)的目前方法已限于全長cDNA克隆的Sanger測序、和/或來自每種mRNA的5'末端或3'末端的小"標(biāo)記"的測序。這些測序方法是勞動(dòng)密集型的,并且它們的普遍采用已被技術(shù)限制阻礙。一般地,用于測序mRNA的方法包括生成cDNA文庫和測序cDNA文庫的插入片段。適合于快速測序形式的cDNA文庫產(chǎn)生是具有許多技術(shù)上困難步驟的長期繁重過程??偟膩碚f,用于從細(xì)胞中分離mRNA的一般程序需要(1)破裂細(xì)胞以釋放細(xì)胞內(nèi)容物,(2)從細(xì)胞中分離總RNA,(3)通過使提取的RNA經(jīng)過寡脫氧胸苷酸纖維素柱來選擇mRNA群體,和(4)使用依賴于RNA的DNA聚合酶(逆轉(zhuǎn)錄酶)從RNA合成cDNA,以合成cDNA的第一條鏈,(5)通過依賴DNA的DNA聚合酶例如大腸桿菌(Ec'o/,)polI克列諾片段,從cDNA合成第二條鏈以產(chǎn)生雙鏈cDNA,(6)將雙鏈cDNA克隆到載體內(nèi),和(7)將載體轉(zhuǎn)染到宿主(例如,細(xì)菌)內(nèi)。在RNA存在的所有階段,必需非常小心以確保制劑不接觸到可以破壞RNA的活性核糖核酸酶。核糖核酸酶(RNA酶)是非常穩(wěn)定的,因此即使mRNA制劑中非常少量的活性酶也將造成問題,例如RNA降解。因?yàn)閏DNA克隆程序的目的是獲得包含基因完整編碼序列的"全長"cDNA克隆,所以使用維持mRNA完整性的程序是極其重要的。cDNA文庫5,末端表現(xiàn)不足(underrepresentation)是目前技術(shù)的固有限制,且由許多因素引起。一種最重要的因素是通過逆轉(zhuǎn)錄酶的延長過程的隨機(jī)失效。因?yàn)槟孓D(zhuǎn)錄酶從mRNA的3'移動(dòng)到5,末端,所以一定百分比的逆轉(zhuǎn)錄酶可能從RNA模板解離,從而引起cDNA合成過早終止。另一種起作用的因素是逆轉(zhuǎn)錄酶在mRNA二級結(jié)構(gòu)區(qū)域暫停、減緩或停止。此外,3,末端偏倚也由污染性RNA酶引入,所述RNA酶經(jīng)由降解去除mRNA的5,末端。這些因素的累積結(jié)果是mRNA的3'末端比更靠近5,末端的序列在統(tǒng)計(jì)學(xué)上更可能在目前的cDNA文庫中表現(xiàn)。對于長轉(zhuǎn)錄物,這種3,偏倚進(jìn)一步得到增強(qiáng),因?yàn)楦L的轉(zhuǎn)錄物對于每種3'偏倚因素更易感。目前cDNA文庫生產(chǎn)技術(shù)的另外缺點(diǎn)包括使用克隆載體和宿主細(xì)胞以擴(kuò)增文庫。宿主載體復(fù)制和/或宿主細(xì)胞/病毒生長可能受cDNA插入片段影響,且某些序列在細(xì)菌或病毒cDNA文庫中將表現(xiàn)不足。例如,當(dāng)cDNA文庫在宿主細(xì)胞中進(jìn)行復(fù)制時(shí),長cDNAs和具有明顯重復(fù)或二級結(jié)構(gòu)潛力的cDNAs可能重排或表現(xiàn)不足。此外,如果cDNA編碼致死基因,那么它在宿主細(xì)胞中的生長可能受到損害。此外,如果cDNA文庫來自共同宿主細(xì)胞,如大腸桿菌cDNA文庫,那么宿主細(xì)胞RNA可能污染結(jié)果。不使用任何宿主細(xì)胞的方法可以避免這個(gè)問題。一般地,例如在涉及病毒或小組織或細(xì)胞樣品的工作中,可用量的起始RNA或DNA可能被極大地限制(例如納克級)。來自此類有限量的原材料的DNA或cDNA文庫制備經(jīng)由本領(lǐng)域目前使用的方法可能是非常困難的或甚至是不可能的。因此本領(lǐng)域需要使得能夠從少量起始核酸制備高質(zhì)量DNA或cDNA文庫的方法。發(fā)明概述本發(fā)明提供了用于形成單鏈cDNA文庫的新方法,所述方法通過使起始RNA(或起始RNAs群體)斷裂,從斷裂的起始RNA引發(fā)和合成單鏈cDNA,和使銜接子序列與單鏈cDNA末端連接來實(shí)現(xiàn)。所得到的單鏈cDNA在5,和3,末端包含已知銜接子序列,保留定向信息,且適合于在某些自動(dòng)化測序系統(tǒng)中自動(dòng)化測序而不需要克隆載體或宿主細(xì)胞,所述自動(dòng)化測序系統(tǒng)例如由454LifeSciences,Branford,CT開發(fā)的測序系統(tǒng)。本發(fā)明的一個(gè)實(shí)施方案涉及用于從起始RNA產(chǎn)生單鏈DNA文庫(例如,cDNA文庫)的方法。該方法包括使RNA斷裂以產(chǎn)生斷裂的RNA的第一個(gè)步驟。斷裂可以進(jìn)行最優(yōu)化以產(chǎn)生大小為100堿基-1000堿基,例如大小為150-500堿基的RNA片段。在任選步驟中,RNA片段可以使用已知技術(shù)例如凝膠電泳或?qū)游鲞M(jìn)行大小分級分離。大小分級分離可以產(chǎn)生100-1000堿基或150-500石咸基的RNAs。斷裂后,斷裂的RNA與多個(gè)引物雜交,所述多個(gè)引物可以從斷裂的RNA上的多個(gè)位置引發(fā)和延長。例如,如果第一個(gè)引物在其雜交區(qū)域中包含隨機(jī)序列,從而使得此類引物群體可能具有可以與任何序列雜交的成員,那么這是可能的。雜交的引物用逆轉(zhuǎn)錄酶延長以形成單鏈cDNA。單鏈cDNA(sscDNA)合成后,RNA可以通過變性條件、NaOH水解、熱處理或RNA酶處理來去除。RNA去除后,第一種DNA銜接子可以與cDNA的5,末端連接。在優(yōu)選實(shí)施方案中,第一種銜接子具有雙鏈部分,以及與sscDNA的5'末端互補(bǔ)的突出(單鏈)5'末端區(qū)域。此外,包含與單鏈cDNA的3,末端互補(bǔ)的突出3'末端區(qū)域的第二種銜接子可以與cDNA的3'末端連4^。5'-第一種銜接子-3'5'----------CDNA—......3'5'—第二種銜接子一3'3'_第一種銜接子5'3'.......第二種銜接子......5'應(yīng)當(dāng)指出在cDNA的5,末端的第一種銜接子連接不是必需的。還可以設(shè)計(jì)摻入非隨機(jī)5,部分的第一鏈cDNA合成引物。這種非隨機(jī)5,部分可以具有第一種銜接子的序列(關(guān)于示例銜接子序列參見圖2)。因?yàn)槿魏嗡玫降腸DNA在5,末端將已具有所需序列,所以在5,末端與第一種銜接子的另外連接不是必需的。第一種和第二種銜接子可以同時(shí)或以任何相繼順序與cDNA連接。此外,第一種銜接子、第二種銜接子、或兩者可以包含結(jié)合對成員用于純化。結(jié)合對可以是顯示互相特異性結(jié)合的任何2種分子,例如FLAG/FLAG抗體;生物素/抗生物素蛋白、生物素/鏈霉抗生物素蛋白、受體/配體、抗原/抗體、受體/配體、polyHIS/鎳、A蛋白/抗體及其衍生物。結(jié)合對可以與第一種或第二種銜接子的任一鏈附著。此外,銜接子的2條鏈可以各自用相同的結(jié)合對成員(例如,2種生物素)進(jìn)行標(biāo)記。與第一種和第二種銜接子連接的單鏈cDNA隨后進(jìn)行純化以形成cDNA文庫。sscDNA純化可以通過大小分級分離來進(jìn)行,因?yàn)閏DNA比銜接子或引物更長。如果cDNA與結(jié)合對的一個(gè)成員(例如,下文描述的生物素)附著,那么它可以通過使用與固體支持體附著的結(jié)合對的第二個(gè)成員(例如,鏈霉抗生物素蛋白、抗生物素蛋白等)進(jìn)行純化。多個(gè)引物可以是包含具有已知特性的一個(gè)或多個(gè)非隨機(jī)引物堿基的半隨機(jī)引物。例如,引物長度可以為10堿基,其中第1堿基(從5,末端計(jì)數(shù))和第4堿基具有已知序列(即,A、G、C、T或U),且其中其他堿基(堿基2、3和5-10)具有未知序列。在優(yōu)選實(shí)施方案中,第一種銜接子包含與多個(gè)引物的非隨機(jī)堿基互補(bǔ)的單鏈區(qū)域(參見,圖1,銜接子A)。多個(gè)引物也可以是半隨機(jī)的,其中非隨機(jī)堿基這樣設(shè)計(jì),從而使得員退1。、多個(gè);I物也可:是非隨機(jī)的,、即是序列特異性的。、i果Ji物具有特異的非隨機(jī)序列,那么它們可能使所得到的DNA或cDNA文庫偏向特異表達(dá)的序列或基因組區(qū)域,或相關(guān)表達(dá)的序列或基因組區(qū)域的2個(gè)或更多成員。在本發(fā)明的任何方法中,寡核苷酸中的任何隨機(jī)堿基位置(A、G、C、T或U)可以由肌普(I)占據(jù),所述肌苷是能夠與任何常見堿基A、G、C、T或U配對的堿基。請求保護(hù)的本發(fā)明的一個(gè)優(yōu)點(diǎn)是無需使用依賴DNA的DNA聚合酶(例如,克列"i若,polI)即可生成cDNA或DNA文庫。即,該方法可以只使用一種聚合酶_逆轉(zhuǎn)錄酶來進(jìn)行。本發(fā)明的另一個(gè)優(yōu)點(diǎn)是無需核酸擴(kuò)增步驟即可生成DNA或cDNA文庫。本發(fā)明還包含通過公開的方法產(chǎn)生的非擴(kuò)增單鏈cDNA文庫。此外,本發(fā)明的文庫可以用于生產(chǎn)扣除(subtraction)文庫,例如cDNA扣除文庫。如果需要,通過添加依賴DNA的DNA聚合酶例如PolI或克列諾聚合酶連接銜接子后,sscDNA可以被制備成雙鏈的。盡管這個(gè)步驟在本發(fā)明的方法中不是必需的,但它可以用于生成用于克隆或其他應(yīng)用的雙鏈cDNA文庫。這些和其他實(shí)施方案在下述詳細(xì)描述中被公開,或由于下述詳細(xì)描述是顯而易見的,且由下述詳細(xì)描述包含。附圖簡述下述詳細(xì)描述作為例子給出但不希望將本發(fā)明限于所述的具體實(shí)施方案,可以結(jié)合引入本文作為參考的附圖理解,其中圖l描述了將銜接子(A和B)定向連接到單鏈cDNA(sscDNA)上的一個(gè)實(shí)施方案。每個(gè)銜接子由具有設(shè)計(jì)為與sscDNA退火的單鏈部分的較長寡核苦酸,和變得與sscDNA的3'和5,末端連接的較短寡核苷酸組成。圖2描述了Tseq(轉(zhuǎn)錄物測序)文庫制備的一個(gè)實(shí)施方案。圖3描述了來自肝cDNA文庫的序列讀數(shù)的5,至3,分布,顯示了均勻的Tseq讀數(shù)分布,即使對于長度超過5,000個(gè)核苷酸的轉(zhuǎn)錄物。圖4描述了一種可能的引物序列。"N"表示任何堿基且"V,,表示除T外的任何堿基(即,"V"表示a、g或c)。圖5描述了3'銜接子與用圖4的引物產(chǎn)生的cDNA的退火。圖6描述了Tseq銜接子結(jié)構(gòu)的某些實(shí)施方案。圖7描述了來自流感毒抹A/PuertoRico/8/34的病毒RNA的AgilentBioanalyzer跡線。峰上的數(shù)字表示核普酸的近似大小。25bp處的峰表示內(nèi)部大小標(biāo)準(zhǔn)。圖8描述了在斷裂前(藍(lán)色跡線)和斷裂后(綠色跡線),來自流感毒林A/PuertoRico/8/34的病毒RNA的AgilentBioanalyzer跡線。紅色跡線表示標(biāo)準(zhǔn)大小標(biāo)記。25bp處的峰表示內(nèi)部大小標(biāo)準(zhǔn)。圖9描述了在特異性3,和5'銜接子連接前,從流感毒林A/PuertoRico/8/34病毒RNA獲得的sscDNA的AgilentBioanalyzer跡線(紅色)。藍(lán)色跡線表示標(biāo)準(zhǔn)大小標(biāo)記。25bp處的峰表示內(nèi)部大小標(biāo)準(zhǔn)。圖IO描述了在18個(gè)擴(kuò)增循環(huán)(圖10A);和25個(gè)擴(kuò)增循環(huán)(圖10B)后,從流感毒林A/PuertoRico/8/34病毒RNA獲得的dscDNA的AgilentBioanalyzer跡線。25bp處的峰表示內(nèi)部大小標(biāo)準(zhǔn)。圖11描述了橫過流感病毒RNA區(qū)段1-4獲得的序列覆蓋度深度圖。圖12描述了橫過流感病毒RNA的3個(gè)不同區(qū)段獲得的序列覆蓋度深度圖。圖13描述的AgilentBioanalyzer跡線顯示dscDNA文庫中的大小分布和相對核酸量,所述dscDNA文庫分別由10、20、50或200ng起始流感病毒RNA構(gòu)建。25bp處的峰表示內(nèi)部大小標(biāo)準(zhǔn)。圖14描述了從10ng(藍(lán)色)或200ng(紅色)起始RNA獲得的序列覆蓋度深度圖。數(shù)據(jù)分別對于A組(頂部;從5,到3'測序)和B組(底部;從起始RNA的3,到5'測序)進(jìn)行標(biāo)繪。這種數(shù)據(jù)還呈現(xiàn)于表3中。該圖揭示從低輸入(10ng)或較高輸入(200ng)的起始RNA獲得等價(jià)覆蓋度模式。圖15描述了本發(fā)明的cDNA文庫制備方法的一個(gè)實(shí)施方案,其中單鏈銜接子與斷裂的起始RNA的5,和3'末端連接。圖16描述了本發(fā)明的cDNA文庫制備方法的一個(gè)實(shí)施方案,其中單鏈銜接子與斷裂的起始RNA的3,末端連接,且單鏈5'末端銜接子(B)在逆轉(zhuǎn)錄后添力口。圖17描述了本發(fā)明的cDNA文庫制備方法的一個(gè)實(shí)施方案,其中部分雙鏈辨f接子與斷裂的起始RNA的3'末端連接,且部分雙鏈5'末端銜接子(B)在逆轉(zhuǎn)錄后添加。圖18(A和B)描述了本發(fā)明的cDNA文庫制備方法的一個(gè)實(shí)施方案,其中起始RNA在逆轉(zhuǎn)錄前無需被斷裂。RNA使用隨機(jī)或半隨機(jī)引物進(jìn)行逆轉(zhuǎn)錄,且A,和B銜接子序列通過連接加入所得到的sscDNA中。圖19描述了本發(fā)明的DNA文庫制備方法的一個(gè)實(shí)施方案,其中銜接的DNA文庫來源于起始DNA。發(fā)明詳述除非另有限定,本文使用的所有技術(shù)和科學(xué)術(shù)語都具有與本發(fā)明所屬領(lǐng)域普通技術(shù)人員通常理解相同的含義。盡管與本文所述那些類似或等價(jià)的許多方法和材料可以在本發(fā)明實(shí)踐中使用,但本文描述了優(yōu)選材料和方法。本發(fā)明的方法提供了超過現(xiàn)有cDNA文庫生產(chǎn)方法的許多利益和優(yōu)點(diǎn)。這些優(yōu)點(diǎn)包括(1)少的起始mRNA量(即,5ng-500ng,其中10ng-200ng是一般的起始量)需求,(2)與常規(guī)cDNA文庫生產(chǎn)和測序比較,消除了3'偏倚,(4)包括更少的總體制備的更快速過程,(5)消除了待測序材料的克隆和擴(kuò)增,和(6)cDNA合成過程自始至終保留了定向性信息(有義或反義方向)。本發(fā)明的方法提供了超過傳統(tǒng)cDNA測序規(guī)程的顯著改善,因?yàn)樗玫降腸DNA文庫包含對于所有轉(zhuǎn)錄物類型顯著減少的3'偏倚。所提供的方法通過使起始RNA斷裂成一致大小范圍(150-500個(gè)核普酸),克服了逆轉(zhuǎn)錄酶持續(xù)合成能力的固有問題,所述一致大小范圍可以通過逆轉(zhuǎn)錄酶可行地逆轉(zhuǎn)錄而無顯著的過早終止。如果起始RNA是mRNA,那么片段將隨機(jī)跨越樣品中呈現(xiàn)的每個(gè)轉(zhuǎn)錄物。這種斷裂的RNA庫隨后經(jīng)歷由半隨機(jī)引物(5'-P-TNNTN6-3')(SEQIDNO:1)驅(qū)動(dòng)的逆轉(zhuǎn)錄反應(yīng)。半隨機(jī)引物的使用導(dǎo)致不同mRNAs的所有片段的一致隨機(jī)逆轉(zhuǎn)錄,且值得注意的是,這種技術(shù)不會偏好RNAs(例如,轉(zhuǎn)錄物)的3,末端超過5,末端。由于2個(gè)原因?qū)⒁镌O(shè)計(jì)成半隨機(jī)的。首先,隨機(jī)性允許它橫過RNA庫內(nèi)的所有片段進(jìn)行引發(fā),從而允許完全覆蓋每個(gè)轉(zhuǎn)錄物。其次,引物的TNNT部分(圖1)可以用作后續(xù)連接反應(yīng)中的定向錨定位點(diǎn)。該方法的一個(gè)優(yōu)點(diǎn)是不進(jìn)行制備雙鏈cDNA的傳統(tǒng)第二條鏈合成,這節(jié)省了時(shí)間且進(jìn)一步避免了由于體外核酸合成的任何人為產(chǎn)物。相反,進(jìn)行連接反應(yīng)以使正向(或A銜接子)和反向(或B銜接子)銜接子與sscDNA附著。A和B銜接子提供關(guān)于任何下游測序規(guī)程的定向信息(圖1)。銜接子組(即,A和B銜接子)以這樣的方式設(shè)計(jì),從而使得允許定向連接正向和反向銜接子,從而導(dǎo)致正向與sscDNA分子的5,末端附著,且反向與sscDNA分子的3,末端附著。連接中使用的每個(gè)銜接子組由互補(bǔ)的2個(gè)引物組成,然而,一個(gè)引物比另一個(gè)長,且因此導(dǎo)致產(chǎn)生突出區(qū)段。連接反應(yīng)中使用的銜接子單位的示意表示顯示于圖1中。較長引物的非互補(bǔ)部分將用作錨定單位以與sscDNA分子退火。一旦這種錨定完成,較短引物就可以與sscDNA的5,或3,末端連接。銜接子單位與sscDNA定向退火和其中發(fā)生連接的示意表示顯示于圖1中。許多方法可用于使連接的sscDNA與未連接的材料分離。在一種優(yōu)選方法中,一個(gè)或兩個(gè)銜接子可以在較長鏈(非連接鏈)上用生物素標(biāo)記。商購可得的鏈霉抗生物素蛋白磁珠,例如MyOne(Dynal)用于純化來自連接反應(yīng)的連接的分子。在未連接的材料已從磁珠洗去后,使sscDNA分子解鏈。這是可能的,因?yàn)橹挥秀暯幼拥姆沁B接鏈?zhǔn)巧锼鼗?。解鏈?zhǔn)古ccDNA連接的連接鏈分開,且將連接鏈-cDNA結(jié)構(gòu)釋放到溶液中。這種sscDNA可以從溶液中進(jìn)行純化,以產(chǎn)生準(zhǔn)備好用于測序的最終sscDNA文庫。從溶液中純化sscDNA的許多方法是已知的。在某些實(shí)施方案中,如聚丙烯酰胺葡聚糖(Sephacryl)S-400柱可以用于純化。在優(yōu)選實(shí)施方案中,sscDNA使用RNAclean(Agencourt)進(jìn)行純化,以幫助去除大多數(shù)非常小的片段以及銜接子的未連接的引物。在一個(gè)實(shí)施方案中,B銜接子組是生物素標(biāo)記的,從而使得可以使用鏈霉抗生物素蛋白包被的磁珠使連接的cDNA分子與未連接的sscDNA分子以及未連接的銜接子分離。sscDNA從珠解鏈且在產(chǎn)生最終sscDNA文庫前經(jīng)歷提純步驟。這個(gè)文庫隨后進(jìn)行定量和稀釋至用于直接測序的正確濃度。直接測序可以例如使用454LifeSciences測序-見程和裝置來進(jìn)行。盡管使用454LifeSciences技術(shù)的測序是優(yōu)選的,但測序可以使用任何技術(shù),包括傳統(tǒng)克隆和人工測序技術(shù)來進(jìn)行。此類人工測序方法包括但不限于,Maxam-Gilbert測序、Sanger測序、合成測序,例如焦;壽酸測序(pyrosequencing)。另一種^則序方;^包4舌4吏用引4勿PCR擴(kuò)增個(gè)別sscDNA,所述引物設(shè)計(jì)為與sscDNA任一末端上的已知序列(即,A銜接子和B銜接子區(qū)域)雜交,隨后測序。已提供了用于產(chǎn)生RNA文庫的策略概述,下文更詳細(xì)地描述本發(fā)明的方法的每個(gè)個(gè)別步驟。趟始7M4RNA、核糖體RNA、轉(zhuǎn)移RNA、病毒RNA和微小RNA。一個(gè)優(yōu)選的RNA來源是細(xì)胞RNA。細(xì)胞RNA可以使用已知方法進(jìn)行分離,例如使用8M鹽酸胍或Tnzol試劑分離。本領(lǐng)域普通技術(shù)人員熟悉常用于處理RNA的技術(shù),例如在與目的RNA接觸的所有溶液中使用焦石友酸二乙酯(DEPC)處理的水。RNA可以但不需是聚腺苷酸富集的。如果聚腺苷酸富集的RNA是所需的,那么它可以使用產(chǎn)生聚腺苷酸RNA的任何方法獲得。此類方法包括例如在寡脫氧胸苷酸纖維素基質(zhì)上通過且結(jié)合聚腺普酸RNA溶液,從基質(zhì)洗去未結(jié)合的RNA,且使用低離子強(qiáng)度緩沖液(低鹽緩沖液)從基質(zhì)釋放聚腺苷酸RNA。分離聚腺苷酸RNA的其他方法包括使用寡脫氧胸苷酸偶聯(lián)的磁介質(zhì),例如裝填寡脫氧胸苦酸的磁珠(Dymil)。jRA^錄襲起始RNA可以通過本領(lǐng)域已知的任何方法進(jìn)行斷裂,所述方法包括機(jī)械剪切、超聲處理和霧化。應(yīng)當(dāng)指出斷裂是任選步驟。本發(fā)明的方法可以無需RNA斷裂而進(jìn)行。此外,本發(fā)明的方法可應(yīng)用于使用或不使用斷裂產(chǎn)生的任何大小的RNA,從10堿基、20堿基RNAs開始到1kb、10kb或更多的RNAs。RNA大小的上限取決于RNA逆轉(zhuǎn)錄酶的持續(xù)合成能力。這個(gè)上限將預(yù)期隨著具有更大持續(xù)合成能力的新RNA逆轉(zhuǎn)錄酶或基因工程改造的逆轉(zhuǎn)錄酶的發(fā)現(xiàn)而增加。較低大小范圍中的RNAs例子包括微小RNA和斷裂或降解的RNA。用于使起始RNA斷裂的一種優(yōu)選方法是在鉀和鈣離子的存在下熱誘導(dǎo)mRNA斷裂。簡言之,將RNA置于40mMTris-乙酸鹽、100mM乙酸鉀和31.5mM乙酸鎂溶液中,且于82。C溫育直至達(dá)到所需斷裂量。我們已發(fā)現(xiàn)在上述Tds/乙酸鉀/乙酸鎂溶液中,2分鐘溫育足以使RNA減少至約150-500石威基的大小。斷裂可以例如通過凝力交電泳或Bioanalyzer(Agilent)來監(jiān)控。自然,離子濃度、溫育溫度、和時(shí)間調(diào)整可能是必需的,以使斷裂技術(shù)適應(yīng)不同環(huán)境。斷裂后,RNA可以使用已知技術(shù)來純化。一種RNA純化方法是使RNA樣品脫鹽。脫鹽可以使用來自商業(yè)供應(yīng)者例如Qiagen的商購可得試劑盒(例如,旋轉(zhuǎn)柱)來完成。卓遂cZ)A^0cZ)A^y>合4'.'斷裂后,使用逆轉(zhuǎn)錄酶將RNA逆轉(zhuǎn)錄成cDNA。在一個(gè)優(yōu)選實(shí)施方案中,第一條鏈cDNA合成使用具有序列5,-P-TNNTNNNNNN-3,(SEQIDNO:1)的半隨機(jī)引物來進(jìn)行,其中N表示隨機(jī)序列(A、G、C或T)且P是5,磷酸。設(shè)計(jì)引物以使用3,NNNNNN區(qū)域(SEQIDNO:17)在斷裂的mRNAs上隨機(jī)引發(fā)。盡管這種poly(N)區(qū)域長度優(yōu)選為6堿基,但也預(yù)期7堿基、8堿基、9堿基或10堿基的poly(N)區(qū)域。引物還包含可以用于正向銜接子后續(xù)定向連接的銜接子序列(5,-TNNT-3,)。應(yīng)當(dāng)理解本文公開的引物序列用于舉例說明性目的,且引物序列TNNTNNNNNN(SEQIDNO:1)中的Ts可以替換為任何2種已知堿基。例如,下述引物也可以在本發(fā)明實(shí)踐中起作用ANNANNNNNN(SEQIDNO:2)、GNNGNNNNNN(SEQIDNO:3)、C麗CNNNNNN(SEQIDNO:4)、ANNGNNNNNN(SEQIDNO:5)、A麗CNNNNNN(SEQIDNO:6)、ANNTNNNNNN(SEQIDNO:7)、GNNANNNNNN(SEQIDNO:8)、G麗CNNNNNN(SEQIDNO:9)、GNNTNNNNNN(SEQIDNO:10)、CNNANNNNNN(SEQIDNO:11)、CNNGNNNNNN(SEQIDNO:12)、C麗TNNNNNN(SEQIDNO:13)、TNNANNNNNN(SEQIDNO:14)、T麗GNNNNNN(SEQIDNO:15)和TNNCNNNNNN(SEQIDNO:16)。本發(fā)明的任何引物、寡核苷酸、核苷酸、核苷和核;咸基(nucleobase)可以包含本領(lǐng)域已知的一種或多種化學(xué)修飾和取代,例如硫代磷酸酯取代,修飾的糖部分例如2,-0-曱基或2,-0-乙基取代糖,化學(xué)發(fā)光或熒光標(biāo)記,例如但不限于辣根過氧化物酶、羅丹明、熒光素、和可從MolecularProbes獲得的Alexa標(biāo)記,質(zhì)量標(biāo)記,封閉基團(tuán)或保護(hù)基,和半抗原例如生物素。如前所述,預(yù)期具有(銜接子A)NNNNNN(SEQIDNO:17)的獨(dú)特5,序列區(qū)域的5,引物的使用。在其5,末端具有銜接子序列的此類引物將節(jié)省第一種銜接子的后續(xù)連接(即,節(jié)省了一個(gè)連接步驟)。用此類引物合成cDNA后,只需要3'銜接子連接。使用引物和逆轉(zhuǎn)錄酶,可以從斷裂的起始RNAs合成sscDNA。銜接子序列的序列可以例如在圖2中找到。/傘#子遂凝.-第一條鏈合成后,將sscDNA純化且置于連接反應(yīng)內(nèi)以給其5,和3,末端添加銜接子序列。銜接子是具有部分單鏈區(qū)域的短核酸,所述單鏈區(qū)域-沒計(jì)為以定向方式與sscDNA雜交和連4妻(例如,游f接子A與sscDNA的5,末端且銜接子B與sscDNA的3,末端,參見圖1)。示例銜接子結(jié)構(gòu)顯示于圖6中。銜接子A可以是具有突出5,單鏈區(qū)域的雙鏈DNA。例如,部分單鏈和部分雙鏈的銜接子A可以包含序列5'-OH-nnnnnn-OH-3'(SEQIDNO:17)3'雙脫氧(SEQIDNO:29)3,雙脫氧防止鏈與另一種核酸連接。這種序列將與sscDNA的5,區(qū)域特異性雜交,所述sscDNA由序列5,-P-innJnnnnnn-3,(SEQIDNO:1)的引物延長來制備(參見,圖1)。如上文所討論的,銜接子A的下劃線堿基設(shè)計(jì)為與引物序列的下劃線堿基互補(bǔ)。作為進(jìn)一步的舉例說明,如果引物序列是5,-gnngnmmnn-3,(SEQIDNO:3),那么^f舒接子A應(yīng)當(dāng)具有序列5'-OH-nnnnnn-OH-3'(SEQIDNO:17)mm3'雙脫氧-nnnnnn£nn£-生物素-5'(SEQIDNO:30)銜接子B可以是具有突出3'區(qū)域的任何雙鏈DNA。例如,銜接子B可以具有序列5'-P-nnnnnn-3'雙脫氧(SEQIDNO:17)mm3'-P-nnnnnnnnnn-OH-5'(SEQEDNO:18)這種銜接子可以與任何單鏈DNA的3,末端雜交,且銜接子B的較短鏈可以與單鏈DNA連接。應(yīng)當(dāng)指出本公開內(nèi)容的圖和上下文中所示的雙脫氧表示防止核酸連接的封閉基團(tuán)。這些雙脫氧基團(tuán)可以替換為功能相當(dāng)?shù)娜魏畏忾]基團(tuán)(即,可以防止核酸鏈連接的封閉基團(tuán))??商娲兀梢圆皇褂梅忾]基團(tuán)。銜接子A和銜接子B的雙鏈區(qū)域可以包含任何序列-包括隨機(jī)序列。在優(yōu)選實(shí)施方案中,銜接子B在其雙鏈區(qū)域中可以包含限制性內(nèi)切核酸酶切割位點(diǎn)、已知的測序引物位點(diǎn)、或兩者。在更優(yōu)選的實(shí)施方案中,銜接子A和銜接子B的雙鏈區(qū)域可以包含結(jié)合對的一個(gè)成員-結(jié)合部分-以用于引物的后續(xù)純化。銜接子A和銜接子B各自包含2條鏈-可以與單鏈核酸連接的鏈和不能與單鏈核酸連接的鏈-在本文中稱為"連接鏈"和"非連接鏈"。在優(yōu)選實(shí)施方案中,銜接子A或銜接子B的非連接鏈包含結(jié)合對的一個(gè)成員_例如生物素。有用的結(jié)合對包括例如,生物素/抗生物素蛋白、生物素/鏈霉抗生物素蛋白、polyHIS區(qū)域/NTA、FLAG/抗FLAG抗體、抗原/抗體或抗體片段等。純化顯著減少多聯(lián)體例如引物二聚體的形成。單鏈cDNA文庫的產(chǎn)生在銜接子連接后完成。cDNA文庫可以用于需要cDNA文庫的任何分子生物學(xué)程序。在一個(gè)實(shí)施方案中,cDNA由單個(gè)組織的RNA產(chǎn)生。在其他實(shí)施方案中,cDNA可以由多個(gè)組織、一種或多種細(xì)胞、體液、一個(gè)或多個(gè)生物、環(huán)境樣品、生物膜、一種或多種細(xì)菌、一種或多種古菌、一種或多種真菌、一種或多種植物、一種或多種動(dòng)物、一個(gè)或多個(gè)人、病毒、逆轉(zhuǎn)錄病毒、噬菌體、寄生物、腫瘤或胂瘤樣品、和/或生物樣品的RNA單個(gè)組織的表達(dá)水平(即,轉(zhuǎn)錄特征分析)。在優(yōu)選實(shí)施方案中,測序使用來自454LifeSciences的方法和裝置來進(jìn)行。用于核酸直接測序的方法可以見于2004年1月28日提交的共同未決的美國專利申請USSN:10/767,779,2003年6月6日才是交的USSN:60/476,602;2003年6月6日提交的USSN:60/476,504;2003年1月29日提交的USSN:60/443,471;2003年6月6日提交的USSN:60/476,313;2003年6月6日提交的USSN:60/476,592;2003年4月23日提交的USSN:60/465,071;和2003年8月25日提交的USSN:60/497,985。,i的cZ)A^vX岸W遂^.'sscDNA可以在任選步驟中進(jìn)行純化。一種純化方法是通過大小選擇。從起始RNA產(chǎn)生的RNA片段大小為100堿基-1000堿基,優(yōu)選大小為150-500堿基,且從RNA片段產(chǎn)生的sscDNA預(yù)期在大小方面是可比較的。這種大小大于銜接子和引物的大小。因此,cDNA可以通過大小分級分離進(jìn)行純化-所述大小分級分離可以通過柱層析(包括旋轉(zhuǎn)柱)、聚丙烯酰胺凝膠電泳、瓊脂糖凝膠電泳、或使用SPRI珠(RNAclean,Agencourt)來進(jìn)行。在其中結(jié)合部分被摻入連接鏈內(nèi)的情況下,sscDNA可以通過親和結(jié)合來回收。例如,未連接的銜接子和銜接子的未連接的鏈可以通過變性條件例如熱處理或堿處理來去除。變性處理后,包含結(jié)合對的一個(gè)成員(例如,生物素)的連接的SSCDNA可以與包含結(jié)合對的另一個(gè)成員的固體支持體(例如,抗生物素蛋白包被的磁珠)結(jié)合。洗滌以去除未結(jié)合的核酸后,純化的sscDNA可以與固體支持體分開。在其中結(jié)合部分被摻入非連接鏈內(nèi)的情況下,sscDNA可以通過使包含結(jié)合對的一個(gè)成員(例如,生物素)的非連接鏈與包含結(jié)合對的另一個(gè)成員的固體支持體(例如,抗生物素蛋白包被的磁珠)結(jié)合來回收。洗滌后,sscDNA可以通過變性條件來收集。在變性條件下,與非連接鏈雜交的sscDNA被釋放到溶液中,而非連接鏈將保持與固體支持體結(jié)合。因此,可以收集含純化的sscDNA的溶液。本發(fā)明的方法可以以各種方式使用,包括但不限于構(gòu)建消減式(subtractive)cDNA文庫和轉(zhuǎn)錄特征分析(Shimkets等人(1999)."Geneexpressionanalysisbytranscriptprofilingcoupledtoagenedatabasequery."NatBiotechnol17(8):798-803)。在第二個(gè)實(shí)施方案中,本發(fā)明的方法可以涉及轉(zhuǎn)錄物計(jì)數(shù)。在轉(zhuǎn)錄物計(jì)數(shù)中,第一個(gè)引物設(shè)計(jì)為與信使RNA的聚腺苷酸尾雜交。生產(chǎn)的cDNA文庫將富集接近聚腺苷酸尾的cDNA序列。在這種方法中,RNA以與上述轉(zhuǎn)錄物測序(TSEQ)規(guī)程相同的方式來斷裂。然而,在這種情況下,使用聚腺苷酸分離的RNA是高度優(yōu)選的。用于cDNAs第一條(且大部分時(shí)間唯一的)鏈合成的引物具有2個(gè)區(qū)域。第一個(gè)區(qū)域是設(shè)計(jì)為與聚腺苷酸區(qū)域雜交的5'區(qū)域。這可以是寡脫氧胸苷酸區(qū)域。第二個(gè)區(qū)域包含由圖4中的VN表示的銜接子序列。作為另外的選擇,引物可以包含另外的5,區(qū)域,所述另外的5,區(qū)域包含銜接子序列。因此,引物序列可以是5'-(銜接子A)-ttttttttv-3'(SEQEDNO:19)。在更優(yōu)選的實(shí)施方案中,引物序列可以是5'-(銜接子A)-ttttttttvn-3'(SEQIDNO:20)。在本說明書自始至終,"v"用于表示DNA或RNA堿基a、g或c。換言之,v是除t或u外的任何堿基??商娲?,引物可以包含基因特異性或基因家族特異性序列,以使文庫構(gòu)建偏向基因亞群。如果引物不包含銜接子序列(即,該引物具有如上文所示SEQIDNO:19或SEQIDNO:20所示結(jié)構(gòu),但缺乏"(銜接子A)"序列),那么銜接子序列可在cDNA合成后進(jìn)行連接。cDNA合成后,可以使用下述銜接子結(jié)構(gòu)5'(銜接子B')3'雙脫氧immiii3-P-NNNNNN(銜接子B)-生物素-5'(SEQIDNO:35〉其中銜接子B和銜接子B'是互補(bǔ)序列。這種銜接子結(jié)構(gòu)可以與CDNA的3,末端連接(參見圖5)。應(yīng)當(dāng)指出連接后,一條鏈?zhǔn)巧锼鼗那疫B接的cDNA可以通過鏈霉抗生物素蛋白柱或鏈霉抗生物素蛋白珠進(jìn)行純化。所得到的cDNA可以用于以與上文所述Tseq測序相同的方式測序。在另外的實(shí)施方案中,起始RNA斷裂后,單鏈寡核苷酸銜接子(其可以是DNA或RNA)可以與斷裂的RNA連接(例如使用T4RNA連接酶)。如圖15中所示,與RNA的3,末端連接的銜接子可以是銜接子A,且與RNA的5'末端連接的銜接子可以是銜接子B'。后續(xù)逆轉(zhuǎn)錄可以由與銜接子A互補(bǔ)的RT引物起始。逆轉(zhuǎn)錄后,RNA鏈可以通過本文公開的任何方法來去除,所述方法包括水解或RNA酶H處理,這之后最終銜接的sscDNA可以進(jìn)行純化。最終攤f接的sscDNA包含在5,末端的A,銜接子序列和3'末端的B銜接子序列。在另一個(gè)實(shí)施方案中(圖16),起始RNA斷裂后,單鏈寡核苷酸銜接子(其可以是DNA或RNA)可以與斷裂的RNA的3,末端連接(例如使用T4RNA連接酶)。后續(xù)逆轉(zhuǎn)錄可以由與銜接子A互補(bǔ)的RT引物起始。逆轉(zhuǎn)錄后,RNA鏈可以通過本文公開的任何方法來去除,所述方法包括水解或RNA酶H處理。如圖16中所示,所得到的A'銜接的sscDNA可以與部分雙鏈的寡核苷酸銜接子組B連接。寡核苷酸銜接子組B的一條鏈包含在其3'末端的隨機(jī)或半隨機(jī)序列的單鏈部分,和在其5'末端的生物素或類似親和標(biāo)記。如本文其他地方所述,隨后可以通過抗生物素蛋白或鏈霉抗生物素蛋白來捕獲連接產(chǎn)物,并使最終A,-B銜接的sscDNA解鏈(圖16)。在另外一個(gè)實(shí)施方案中(圖17),起始RNA斷裂后,如圖17中所示,部分雙鏈的寡核苷酸銜接子組A與RNA的3'末端連接。寡核苷酸銜接子組A的一條鏈包含在其3,末端的隨機(jī)或半隨機(jī)序列的單鏈部分,和在其5,末端的生物素(或其他合適的親和標(biāo)記)。隨后可以通過抗生物素蛋白或鏈霉抗生物素蛋白(或其他合適的結(jié)合配偶體)來捕獲連接產(chǎn)物,并使連接的RNA解鏈。隨后,逆轉(zhuǎn)錄可以由至少部分與銜接子A序列互補(bǔ)的RT引物來起始。逆轉(zhuǎn)錄后,RNA鏈可以通過本文公開的任何方法來去除,所述方法包括水解或RNA酶H處理,這之后A銜接的sscDNA可以進(jìn)行純化。如圖17中所示,使部分雙鏈的DNA寡核苷酸銜接子組B與這種A銜接的sscDNA的3'末端連接(例如,使用T4DNA連接酶);寡核苷酸銜接子組B的一條鏈包含在其3,末端的隨機(jī)或半隨機(jī)序列的單鏈部分,和在其5,末端的生物素(或其他合適的親和標(biāo)記)。如本文其他地方所述,隨后可以通過抗生物素蛋白或鏈霉抗生物素蛋白(或其他合適的結(jié)合配偶體)來捕獲連接產(chǎn)物,并使最終A,-B銜接的sscDNA解鏈(圖17)。在這個(gè)和本文所述的其他實(shí)施方案中,技術(shù)人員將理解不合需要的銜接子-銜接子連接事件可以通過下述來防止適當(dāng)?shù)貙⒑线m的化學(xué)結(jié)構(gòu)(例如,磷酸基、或雙脫氧基團(tuán)的存在或不存在)放置在寡核苷酸的3,和/或5,末端上。在本發(fā)明的某些實(shí)施方案中,用于制備cDNA文庫的方法不需要斷裂起始RNA(例如圖18A和B)。在這些實(shí)施方案中,隨機(jī)或半隨機(jī)逆轉(zhuǎn)錄引物與未斷裂的起始RNA退火,且進(jìn)行逆轉(zhuǎn)錄。例如,逆轉(zhuǎn)錄引物可以包含隨機(jī)或半隨沖幾的5,部分和恒定的3,部分。如果使用的逆轉(zhuǎn)錄酶是非鏈置換的,那么逆轉(zhuǎn)錄可以從每個(gè)退火的引物延續(xù)直至下一個(gè)退火的引物,或直至達(dá)到RNA的5,末端。技術(shù)人員將理解所得到的sscDNA片段的平均長度尤其取決于引物與起始RNA的比率。逆轉(zhuǎn)錄后,RNA鏈可以通過本文公開的任何方法來去除,所述方法包括水解或RNA酶H處理,這之后各自在其5,末端包含逆轉(zhuǎn)錄引物的sscDNA片段可以進(jìn)行純化。sscDNA的5'末端隨后可以與部分雙鏈的寡核苷酸銜接子組A,連接(例如使用T4DNA連接酶)。銜接子組A,包含的一條鏈在其5'末端具有隨機(jī)或半隨機(jī)序列的單鏈部分。sscDNA的3,末端可以與部分雙鏈的寡核苦酸銜接子組B連接(例如使用T4DNA連接酶)。銜接子組B包含的一條鏈在其3'末端具有隨機(jī)或半隨機(jī)序列的單鏈部分,和在其5,末端具有生物素(或其他合適的親和標(biāo)記)(圖18A)。如本文其他地方所述,隨后可以通過抗生物素蛋白或鏈霉抗生物素蛋白(或其他合適的結(jié)合配偶體)來捕獲連接產(chǎn)物,并使最終A,-B銜接的sscDNA解鏈(圖18B)。銜接子組A,的"底部,,鏈(根據(jù)圖18)同樣將解鏈,且可以通過本領(lǐng)域已知和本文描述的許多大小選擇程序中的任何一種,例如SPRI珠,與所需的最終A'-B銜接的sscDNA分開。本發(fā)明的某些實(shí)施方案涉及DNA文庫而不是cDNA文庫的產(chǎn)生。在這些實(shí)施方案中,原材料是單鏈或雙鏈DNA。起始DNA可以來源于任何生物(細(xì)胞或病毒)或合成來源。如果起始DNA是單鏈的,那么它可以例如已來源于變性雙鏈DNA,或可以乂人單鏈DNA病毒中分離。如果起始DNA片段的長度超過所需DNA文庫要求的長度,那么它可以通過本領(lǐng)域已知的任何方法來斷裂,所述方法可以是酶促(例如限制酶)、化學(xué)、或機(jī)械的(例如剪切)。如果起始DNA是雙鏈的,那么片段例如通過熱處理進(jìn)行變性以產(chǎn)生ssDNA片段。ssDNA片段的5,末端隨后可以與部分雙鏈的寡核苷酸銜接子組A,連接(例如使用T4DNA連接酶)。銜接子組A,包含的一條鏈在其5'末端具有隨機(jī)或半隨機(jī)序列的單鏈部分。ssDNA的3,末端可以與部分雙鏈的寡核苷酸銜接子組B連接(例如使用T4DNA連接酶)。銜接子組B包含的一條鏈在其3,末端具有隨機(jī)或半隨機(jī)序列的單鏈部分,和在其5,末端具有生物素(或其他合適的親和標(biāo)記)(圖19)。如本文其他地方所述,隨后可以通過抗生物素蛋白或鏈霉抗生物素蛋白(或其他合適的結(jié)合配偶體)來捕獲連接產(chǎn)物,并使最終A,-B銜接的ssDNA解鏈。銜接子組A,的"底部"鏈(根據(jù)圖19)同樣將解鏈,且可以通過本領(lǐng)域已知和本文描述的許多大小選擇程序中的任何一種,例如SPRI珠,與所需的最終A,-B銜接的ssDNA分開。在本公開內(nèi)容自始至終,術(shù)語"生物素""抗生物素蛋白"或"鏈霉抗生物素蛋白"已用于描述結(jié)合對的成員。應(yīng)當(dāng)理解這些術(shù)語僅用于舉例說明使用結(jié)合對的一種方法。因此,術(shù)語生物素、抗生物素蛋白、或鏈霉抗生物素蛋白可以用結(jié)合對的任何一個(gè)成員替換。結(jié)合對可以是顯示互相特異性結(jié)合的任何2種分子,且至少包括結(jié)合對,例如FLAG/FLAG抗體;生物素/抗生物素蛋白、生物素/鏈霉抗生物素蛋白、受體/配體、抗原/抗體、受體/配體、polyHIS/鎳、A蛋白/抗體及其衍生物。其他結(jié)合對是已知的且在文獻(xiàn)中公開。本公開內(nèi)容中任何地方引用的所有專利、專利申請和參考文獻(xiàn)均在此整體引入作為參考。本發(fā)明的其他實(shí)施方案和優(yōu)點(diǎn)部分在隨后的說明書中闡述,且部分由于本說明書將是顯而易見的,且可以從本發(fā)明實(shí)踐中學(xué)習(xí)。本發(fā)明現(xiàn)在將通過下述非限制性實(shí)施例進(jìn)一步描述。實(shí)施例實(shí)施例1材沖牛和方法該規(guī)程已被開發(fā)用于從200ngmRNA材料開始工作。這種規(guī)程的示意圖顯示于圖2中。關(guān)于該方法的起始體積為10^1。將樣品置于冰上,且將2.5pl5X斷裂緩沖液(0.2MTris乙酸鹽、0.5M乙酸鉀和157.5mM乙酸鎂)加入樣品中,且充分混合。將樣品置于熱循環(huán)儀中且加熱至82°C,且允許于82。C溫育2分鐘。緊在于82。C溫育后,將樣品移回到冰上。在脫鹽步驟中從樣品中去除鹽。使樣品脫鹽的方法是眾所周知的。本文使用的規(guī)程包括根據(jù)制造商的說明書使樣品通過Autos叫G-50柱(AmershamBiosciences)?;厥盏募s20fil體積材料通過于45。C在speed-vac(SavantSpeedVacConcentratorSystems)中、在真空下(2Torr)離心干燥減少至10pl。逆轉(zhuǎn)錄引物與mRNA沖莫板的退火通過將2itil逆轉(zhuǎn)錄引物(200[iM5,-P-TNNTNNNNNN-3,,其中P表示石辟酸,SEQIDNO:l)添加到斷裂的mRNA中來進(jìn)行。隨后,將樣品在熱循環(huán)儀中加熱至70°C10分鐘且在水上冷卻。向反應(yīng)管中加入8.5微升逆轉(zhuǎn)錄混合物(4.0pi5XSuperscriptIIFirstStrandBuffer,2.00.1MDTT,l.O^ldNTP混合物(各為10mM),1.0|ul50單位1的SuperscriptII酶(Invitrogen)和0.5pi125單位/^il的RNaseOut(Invitrogen))。使反應(yīng)管充分混合且于45。C溫育1小時(shí)。這個(gè)反應(yīng)后sscDNA分子通過添加15W變性溶液(0.5MNaOH,0.25MEDTApH8.0)來分離、混合且于65。C溫育20分鐘。反應(yīng)通過添加20中和纟爰沖液來纟冬止。隨后,反應(yīng)4吏用QiagenMinEluteDNAPurificationColumns根據(jù)制造商的說明書進(jìn)行純化,除了洗脫體積外。反應(yīng)用12pi10mMTris-ClpH7.5來洗脫。銜接子A和銜接子B的連接通過向樣品中添加6.5pi連接混合物(1.0^125^M銜接子A,1.0pi50^M銜接子B,1.8(illOXT4連接酶緩沖液,2.2|iU水和0.5(il2000單位1的高濃度T4DNA連接酶(NewEnglandBiolabs))來確立。使樣品混合且于22。C溫育12小時(shí)。連接產(chǎn)物通過生物素標(biāo)記的B銜接子與MyOne鏈霉抗生物素蛋白磁珠(Dynal)結(jié)合根據(jù)下述程序來分離。應(yīng)當(dāng)理解與相應(yīng)結(jié)合對結(jié)合的任何形式的磁珠例如鏈霉抗生物素蛋白珠將起作用。連接反應(yīng)體積通過添加1XTEpH7.5增加至100|Lil。隨后向樣品中加入包含100pl洗過的磁珠的漿液。使樣品于室溫混合10-15分鐘,且隨后洗滌珠以去除任何未結(jié)合的材料。sscDNA進(jìn)行解鏈且用100|ul洗脫緩沖液(25mMNaOH,1mMEDTA,0.1%Tween-20)從珠中洗脫。將洗脫的材料轉(zhuǎn)移至新管,且用IOilU中和緩沖液(250mMHCl,250mMTris-CLpH8.0)進(jìn)行中和。添加中和緩沖液后,使樣品通過SephacrylS-400層析柱以從sscDNA樣品中去除小片段。樣品隨后在QuiagenMinElute柱上根據(jù)制造商的規(guī)程進(jìn)行純化。最終sscDNA使用18jj10mMTris-HClpH7.5從柱洗脫且使用小等分試樣以QC文庫。對小鼠肝mRNA樣品進(jìn)行的這種規(guī)程的研究提供覆蓋所有大小轉(zhuǎn)錄物的大量序列數(shù)據(jù)。為了測定較長轉(zhuǎn)錄物的序列覆蓋度,標(biāo)繪出大于5000個(gè)核苷酸的所有轉(zhuǎn)錄物的每個(gè)區(qū)域的命中數(shù)目。觀察到序列覆蓋度橫過這些轉(zhuǎn)錄物全長的均勻分布,從而暗示即使長度大于5000個(gè)核苷酸的轉(zhuǎn)錄物也顯示很少至沒有3,偏倚(參考圖3)。實(shí)施例2流感病毒基因組的cDNA文庫制備和測序流感病毒抹A/PuertoRico/8/34的RNA基因組材料購自CharlesRiverLaboratories(Wilmington,MA)。流感基因組已知包含單鏈負(fù)義RNA的8個(gè)區(qū)段。所有區(qū)段的總長為3500nt。起始RNA材料被發(fā)現(xiàn)存在于對應(yīng)于病毒RNA區(qū)段的不同大小級分中(圖7)。在cDNA文庫制備中使用各種起始量(10ng、20ng、50ng或200ng)的RNA。對于RNA斷裂,將在10^U體積中的起始量RNA加入2.5pl5x斷裂緩沖液(200mMTris-乙酸鹽,500mM乙酸鉀,157.5mM乙酸鎂,pH8.1)中,短暫渦旋,且于82。C溫育2分鐘,隨后在水上冷卻。為了使斷裂RNA提純,用10mMTns-HCl,pH7.5將樣品體積調(diào)整至50|iil。添加IOO微升RNAClean珠混合物(Agencourt,BeverlyMA),混合且在室溫下溫育10分鐘。隨后將珠收集到磁性顆粒收集器單元上。棄去上清液,且用70%乙醇將珠洗滌2次。將珠風(fēng)干,隨后用ll|iillOmMTris-HClph7.5洗脫RNA,得到約9.5|iil洗脫物。斷裂導(dǎo)致產(chǎn)生廣泛大小范圍的RNA,其中峰在約500個(gè)核苷酸處(圖8)。為了制備單鏈cDNA(sscDNA),全部洗脫物隨后與2200pM引物P-TNNTNNNNNN(SEQIDNO:1)混合,且加熱至70°C10分鐘,隨后在冰上快速冷卻。此后,添加8.5(il冰冷的逆轉(zhuǎn)錄混合物(4|ul5XSSII第一鏈緩沖液(FirstStrandBuffer)[Invitrogen,Carlsbad,California],2pi0.1MDTT,1pidNTP混合物[IOmM每種dNTP],1piSuperscriptII逆轉(zhuǎn)錄酶[Invitrogen],和0.5piRNaseOut[Invitrogen]),隨后混合。使混合物于45。C溫育1小時(shí),隨后置于冰上。添加變性溶液(0.5MNaOH,0.25MEDTA),混合,且于65。C溫育20分鐘。添加cDNA中和溶液(0.5MHC1,0.5MTns-Cl)(10-40)以達(dá)到pH7-8.5。樣品通過添加1.5體積RNAClean混合物來純化,且在室溫下溫育10-15分鐘。隨后將珠收集到磁性顆粒收集器單元上。棄去上清液,且用70%乙醇將珠洗滌2次。將珠風(fēng)干,隨后用25(il10mMTns-HCl,pH7.5洗脫sscDNA。因此獲得的sscDNA大小分布集中在約500個(gè)核苦酸處的峰周圍(圖9)。對于銜接子連接,使SAD1F寡核苷酸與sscDNA的5'末端連接,且使SAD1R寡核苷酸與sscDNA的3,末端連接。為此,向sscDNA樣品中加入6pl銜接子/緩沖液混合物(3pi10XT4DNA連接酶緩沖液(LigaseBuffer)[NewEnglandBiolabs,Ipswich,MA],1pi50一SADlF/SADlFprime(1.2:1),1(al200|iMBio-SADlR/SADlRprime(1.2:1),和1(ilQuickLigase或T4DNALigaseHighCone.[NewEnglandBiolabs]),且于22。C溫育12小時(shí)。這次溫育后,添加IXTE(pH8.0)以達(dá)到具有l(wèi)OO^il終體積的連接混合物。寡核苷酸序列顯示于表1中。表1名稱序列(5'-3')修飾SEQIDNOSAD1F(TCAG)GCCTCCCTCGCGCCATCAG無21SADFprimeO'CAG)N*A*N*NACTGATGGCGCGAGGGA*G*G*/3ddC*=硫代磷酸酯化》咸基,3'-雙脫氧-C22SAD1R(TCAG)GCCTTGCCAGCCCGCTCAGNNNN*N*N*5'-生物素,3'-磷酸,*=硫代磷酸酯化堿基23SADlRprime(TCAG)CTGAGCGGGCTGGCAAGG/3ddC5,-磷酸,3'-雙脫氧-C24部分雙鏈的寡核苷酸SADlF/SADlFprime通過下述制備,以1:1.2的摩爾比組合SAD1F和SADlFprime單鏈寡核普酸,和使用下述熱程序退火80。C5分鐘,65。C7分鐘,6(TC7分鐘,55。C7分鐘,5CTC7分鐘,45。C7分鐘,40。C7分鐘,35。C7分鐘,30。C7分鐘,25。C7分鐘,4。C不定。部分雙鏈的寡核普酸SADlR/SADlRprime以相同方式由SAD1R和SADlRprime制備。為了在銜接子連接后分離sscDNA文庫,首先,20pl/樣品的鏈霉抗生物素蛋白石茲(StreptavidinMagnetic)珠(DynalBiotech)如下在B&WBuffer+Tween(10mMTris-ClpH7.5,1mMEDTApH8.0,2MNaCl,0.1%Tween-20)中平衡。在磁性顆粒捕獲單元中使珠與液體分開,且棄去上清液。將珠在1mlB&WBuffer+Tween中洗滌,在磁性顆粒捕獲單元中與液體分開,且棄去上清液。隨后將珠重懸浮于IOO(ilB&WBuffer+Tween/20pi起始珠體積中,且加入100|al連接的混合物(參見上文)中,且攪動(dòng)15分鐘。在磁性顆粒捕獲單元中使珠與液體分開,且棄去上清液。將珠在200pi0.5XB&WBuffer+Tween中洗滌,在磁性顆粒捕獲單元中與液體分開,且棄去上清液。珠在200^1珠洗滌緩沖液(BeadWashBuffer)(10mMTris-ClpH7.5,1mMEDTApH8.0,30mMNaCl,0.1%Tween-20)中洗滌2次,每次在磁性顆粒捕獲單元中使珠與液體分開,且棄去上清液。添加100pi珠洗脫緩沖液(BeadElutionBuffer)(25mMNaOH,1mMEDTA,0.1%Tween-20),且于室溫將樣品攪動(dòng)10分鐘。在磁性顆粒捕獲單元中使珠與液體分開,且將上清液(包含sscDNA文庫)轉(zhuǎn)移至新PCR管。對于sscDNA文庫純化向珠洗脫緩沖液中的sscDNA中加入140(ilRNACleanMix,隨后混合,且在室溫下溫育IO分鐘。在磁性顆粒捕獲單元中使珠與液體分開,且棄去上清液。珠在70%乙醇中洗滌2次,隨后風(fēng)干。sscDNA在30pl10mMTris-ClpH7.5中進(jìn)行洗脫。如上重復(fù)RNAClean程序,除了從42plRNAClean混合物開始,和最后用12pl10mMTris-ClpH7.5洗脫sscDNA。因此獲得的sscDNA文庫是PCR擴(kuò)增的。將來自上文的2-3^1最終sscDNA洗脫物加入5|tU10XAdvantage2PCRBuffer(Clontech,MountainView,CA)、1.0piSADIF引物(200pM)、1.0|nlSADIRprimer引物(200)、2.0pi10mM每種dNTP、1|nlAdvantage2聚合酶混合物(PolymeraseMix)(Clontech)、和水中至50|^1的總體積。隨后對反應(yīng)混合物實(shí)施下述熱循環(huán)方案步驟1:90。C,4分鐘;步驟2:94°C,30秒;步驟3:64°C,30秒;步驟4:轉(zhuǎn)到步驟2,18次或25次;步驟5:68°C,2分鐘;步驟6:14°C,不定。擴(kuò)增后,反應(yīng)物用AMPure珠(Agencourt)進(jìn)行純化。將80微升AMPure珠混合物加入PCR反應(yīng)中,且在磁性顆粒捕獲單元中使珠與液體分開,且棄去上清液。珠在70%乙醇中洗滌2次,隨后風(fēng)干。擴(kuò)增的雙《連cDNA(dscDNA)文庫在12pi10mMTris-ClpH7.5中進(jìn)行洗脫。發(fā)現(xiàn)18個(gè)擴(kuò)增循環(huán)比25個(gè)擴(kuò)增循環(huán)有利,因?yàn)樵?5個(gè)循環(huán)后(而不是在18個(gè)循環(huán)后),觀察到不合需要的產(chǎn)物以及擴(kuò)增引物的嚴(yán)重耗盡(參見圖IOA和10B)。觀察到由10、20、50或200ng起始病毒RNA獲得的dscDNA文庫的大小分布是高度相似的(圖13),從而證實(shí)本發(fā)明的方法從微量RNA生產(chǎn)cDNA文庫的驚人能力。隨后通過由454LifeSciences(Branford,CT)開發(fā)的測序技術(shù)對因此獲得的cDNA文庫實(shí)施核苷酸測序。用于核酸直接測序的這些技術(shù)已公開于全部于2004年1月28日提交的共同未決的美國專利申請USSN:10〃67,779、10〃67,899、10/768729和10/767,779,以及2005年8月1曰4是交的USSN11/195,254中。獲得約13600個(gè)高質(zhì)量讀數(shù)。在這些中,12820個(gè)(94.26%)在已知流感毒林A基因組中發(fā)現(xiàn)至少35nt的BLAST命中。12820個(gè)BLAST命中在8個(gè)區(qū)段或流感病毒林ARNA基因組中的分布顯示于表2中。表2:通過流感病毒株A的基因組區(qū)段列出的具有BLAST命中的高質(zhì)量讀數(shù)數(shù)目。<table>tableseeoriginaldocumentpage28</column></row><table>橫過流感病毒林aRNA的8個(gè)區(qū)段的覆蓋度深度描述于圖11和12中,這顯示本發(fā)明的方法產(chǎn)生橫過8個(gè)區(qū)段每一個(gè)的覆蓋度。為了評估本發(fā)明的方法在不同起始RNA量上的性能,比較高質(zhì)量讀數(shù)、BLAST陽性讀數(shù)數(shù)目、和BLAST陽性高質(zhì)量讀數(shù)百分比。數(shù)據(jù)顯示不管測序方向,使用10、20、50或200ng原材料獲得相似結(jié)果(表3和圖14)。表3<table>tableseeoriginaldocumentpage28</column></row><table>表3:由10、20、50或200ng起始RNA獲得的測序結(jié)果。測序從5,到3,(A:上面4行)和從3,到5,(B;下面4行)進(jìn)行。HQ:高質(zhì)量讀數(shù);Blast〉35nt:與已知流感病毒抹A序列具有超過35個(gè)核苷酸的陽性BLAST命中的HQ讀數(shù)。%HQBLAST〉35nt:與已知流感病毒林A序列具有超過35個(gè)核苷酸的陽性BLAST命中的HQ讀數(shù)百分比。部分這種數(shù)據(jù)在圖14中圖示??紤]到本文公開的本發(fā)明說明書和實(shí)踐,本發(fā)明的其他實(shí)施方案和用途對于本領(lǐng)域技術(shù)人員將是顯而易見的。無論是為了什么原因在本文中提及的所有專利、專利申請和其他參考文獻(xiàn)都具體引入作為參考。說明書和實(shí)施例應(yīng)僅視為示例性的,而本發(fā)明的真實(shí)范圍和精神由下述權(quán)利要求指出。權(quán)利要求1.一種用于從RNA產(chǎn)生文庫的方法,其包括下述步驟(a)使所述RNA斷裂以產(chǎn)生斷裂的RNAs;(b)使多個(gè)引物與所述斷裂的RNAs雜交以形成雜交的引物;(c)用逆轉(zhuǎn)錄酶使所述雜交的引物延長,以從所述RNA形成多個(gè)單鏈cDNAs,其中所述單鏈cDNAs在5’末端包含所述多個(gè)引物;(d)使第一種銜接子與所述cDNA的所述5’末端連接,其中所述銜接子包含與所述單鏈cDNA的5’末端互補(bǔ)的突出5’末端區(qū)域,和連接包含與所述cDNA的3’末端互補(bǔ)的突出3’末端區(qū)域的第二種銜接子,以形成包含在5’末端的第一種銜接子和在3’末端的第二種銜接子的單鏈cDNA;(e)使所述單鏈cDNAs純化以產(chǎn)生所述cDNA文庫。2.權(quán)利要求1的方法,其中所述斷裂步驟產(chǎn)生大小為20堿基-10kb-成基的斷裂的RNAs。3.權(quán)利要求1的方法,其中所述斷裂步驟產(chǎn)生大小為100堿基-1000堿基的斷裂的RNAs。4.權(quán)利要求l的方法,其中所述斷裂步驟產(chǎn)生大小為150bp-500bp的斷裂的RNAs。5.權(quán)利要求1的方法,其進(jìn)一步包括在所述斷裂步驟后所述斷裂的RNAs的大小選擇步驟。6.權(quán)利要求4的方法,其中所述大小選擇富集大小為150bp-500bp的RNA。7.權(quán)利要求1的方法,其進(jìn)一步包括在延長和連接步驟之間、用RNA酶消化所述斷裂的RNAs的步驟。8.權(quán)利要求1的方法,其中所述多個(gè)引物是包含具有已知特性的一個(gè)或多個(gè)非隨機(jī)引物堿基的半隨機(jī)引物。9.權(quán)利要求8的方法,其中所述第一種銜接子包含單鏈區(qū)域和雙鏈區(qū)域,且其中所述單鏈區(qū)域是在隨機(jī)序列內(nèi)包含具有已知特性的一個(gè)或多個(gè)非隨機(jī)銜接子堿基的半隨機(jī)單鏈區(qū)域,且其中所述非隨機(jī)引物堿基與所述非隨機(jī)銜接子堿基互補(bǔ)。10.權(quán)利要求8的方法,其中所述多個(gè)引物包含序列xnnx且其中所述第一種銜接子的所述半隨機(jī)單鏈區(qū)域包含序列ynny,其中x和y是互補(bǔ)堿基且其中n是隨機(jī)堿基。11.4又利要求10的方法,其中xrnix是tnnt且yrniy是amia。12.權(quán)利要求9的方法,其中所述引物包含序列tnntnnnnnn(SEQIDNO.1)。13.權(quán)利要求1的方法,其中所述第一種銜接子或第二種銜接子進(jìn)一步包含結(jié)合對的一個(gè)成員。14.權(quán)利要求13的方法,其中所述結(jié)合對選自FLAG/FLAG抗體;生物素/抗生物素蛋白、生物素/鏈霉抗生物素蛋白、受體/配體、抗原/抗體、受體/配體、polyHIS/鎳、A蛋白/抗體及其衍生物。15.權(quán)利要求13的方法,其中所述純化步驟包括通過所述結(jié)合對的一個(gè)成員純化所述單鏈cDNA。16.權(quán)利要求l的方法,其中所述純化步驟是大小分級分離步驟。17.權(quán)利要求1的方法,其中所述方法在不存在依賴DNA的DNA聚合酶的情況下進(jìn)行。18.權(quán)利要求13的方法,其中所述結(jié)合對的一個(gè)成員是生物素,且其中所述純化步驟通過使所述單鏈cDNA與鏈霉抗生物素蛋白包^f皮的固體支持體結(jié)合來進(jìn)行。19.權(quán)利要求l的方法,其中所述第一種銜接子包含2條核酸鏈,且其中所述結(jié)合對的一個(gè)成員與所述鏈之一附著。20.權(quán)利要求l的方法,其中所述第二種銜接子包含2條核酸鏈,且其中所述結(jié)合對的一個(gè)成員與所述鏈之一附著。21.權(quán)利要求l的方法,其中所述純化步驟包括使所述cDNA變性以去除與所述cDNA雜交的任何核酸。22.權(quán)利要求20的方法,其中所述變性步驟使所述cDNAs的所述5,和3'末端上的所述第一種和第二種銜接子變性。23.權(quán)利要求1的方法,其進(jìn)一步包括測定所述單鏈cDNAs的至少部分核酸序列的步驟。24.權(quán)利要求1的方法,其進(jìn)一步包括對所述cDNA文庫進(jìn)行cDNA扣除的步驟。25.權(quán)利要求l的方法,其中所述RNA來自單個(gè)組織。26.權(quán)利要求l的方法,其中所述RNA來自選自下述的來源多個(gè)組織、單種細(xì)胞、多種細(xì)胞、體液、單個(gè)生物、多個(gè)生物、環(huán)境樣品、生物膜、細(xì)菌、古菌、真菌、纟直物、動(dòng)物、人、病毒、逆轉(zhuǎn)錄病毒、噬菌體、寄生物、腫瘤、腫瘤樣品或生物樣品。27.權(quán)利要求1的方法,其中所述RNA來自處于相同細(xì)胞周期的細(xì)胞。28.—種非擴(kuò)增的單鏈cDNA文庫,其通過權(quán)利要求1的方法產(chǎn)生。29.—種扣除cDNA文庫,其通過權(quán)利要求28的方法產(chǎn)生。30.—種用于從RNA產(chǎn)生文庫的方法,其包括下述步驟(a)使所述RNA斷裂以產(chǎn)生斷裂的RNAs;(b)使多個(gè)引物與所述斷裂的RNAs雜交以形成雜交的引物,其中所述引物包含具有銜接子序列的5'區(qū)域、和用于與所述斷裂的RNA雜交的3'區(qū)域;(c)用逆轉(zhuǎn)錄酶使所述雜交的引物延長,以形成來自所述RNA的多個(gè)單鏈cDNAs,其中所述單鏈cDNAs在5'末端包含所述多個(gè)引物;(d)連接包含與所述cDNA的3,末端互補(bǔ)的突出3,末端區(qū)域的銜接子,以形成在3,末端包含銜接子的單鏈cDNA;(e)使所述單鏈cDNAs純化以產(chǎn)生所述cDNA文庫。31.權(quán)利要求30的方法,其中所述引物的所述3'區(qū)域包含序列rninmm。32.權(quán)利要求30的方法,其中所迷引物的所述3'區(qū)域包含序列mimmnv。33.權(quán)利要求30的方法,其中所述引物的所述3'區(qū)域包含序列ttttttv。34.權(quán)利要求30的方法,其中所述斷裂步驟產(chǎn)生大小為20堿基-10kb;咸基的斷裂的RNAs。35.權(quán)利要求30的方法,其中所述斷裂步驟產(chǎn)生大小為IOO堿基-1000堿基的斷裂的RNAs。36.權(quán)利要求30的方法,其中所述斷裂步驟產(chǎn)生大小為150bp-500bp的斷裂的RNAs。37.權(quán)利要求30的方法,其進(jìn)一步包括在所述斷裂步驟后所述斷裂的RNAs的大小選擇步驟。38.權(quán)利要求37的方法,其中所述大小選擇富集大小為150bp-500bp的RNA。39.權(quán)利要求30的方法,其中所述RNA是富集聚腺苷酸RNAs的RNA群體。40.權(quán)利要求30的方法,其進(jìn)一步包括在所述延長和所述連接步驟之間、用RNA酶消化所述斷裂的RNAs的步驟。41.權(quán)利要求1的方法,其中所述引物或所述銜接子進(jìn)一步包含結(jié)合對的一個(gè)成員。42.權(quán)利要求40的方法,其中所述結(jié)合對選自FLAG/FLAG抗體;生物素/抗生物素蛋白、生物素/鏈霉抗生物素蛋白、受體/配體、抗原/抗體、受體/配體、polyHIS/鎳、A蛋白/抗體及其衍生物。43.權(quán)利要求42的方法,其中所述純化步驟包括通過所述結(jié)合對的一個(gè)成員純化所述單鏈cDNA。44.權(quán)利要求30的方法,其中所述純化步驟是大小分級分離步驟。45.權(quán)利要求30的方法,其中所述方法在不存在依賴DNA的DNA聚合酶的情況下進(jìn)行。46.權(quán)利要求43的方法,其中所述結(jié)合對的一個(gè)成員是生物素,且其中所述純化步驟通過使所述單鏈cDNA與鏈霉抗生物素蛋白包被的固體支持體結(jié)合來進(jìn)行。47.權(quán)利要求30的方法,其中所述銜接子包含2條核酸鏈,且其中所述結(jié)合對的一個(gè)成員與所述鏈之一附著。48.權(quán)利要求30的方法,其中所述純化步驟包括使所述cDNA變性以去除與所述cDNA雜交的任何核酸。49.權(quán)利要求30的方法,其中所述變性步驟使所述cDNAs的所述3'末端上的所述銜接子變性。50.權(quán)利要求30的方法,其進(jìn)一步包括測定所述單鏈cDNAs的至少部分核酸序列的步驟。51.權(quán)利要求30的方法,其進(jìn)一步包括對所述cDNA文庫進(jìn)行cDNA扣除的步驟。52.權(quán)利要求30的方法,其中所述RNA來自單個(gè)組織。53.權(quán)利要求30的方法,其中所述RNA來自選自下述的來源多個(gè)組織、單種細(xì)胞、多種細(xì)胞、體液、單個(gè)生物、多個(gè)生物、環(huán)境樣品、生物膜、細(xì)菌、古菌、真菌、植物、動(dòng)物、人、病毒、逆轉(zhuǎn)錄病毒、噬菌體、寄生物、腫瘤、腫瘤樣品或生物樣品。54.權(quán)利要求30的方法,其中所述RNA來自處于相同細(xì)胞周期的細(xì)胞。55.—種非擴(kuò)增的單鏈cDNA文庫,其通過權(quán)利要求30的方法產(chǎn)生。56.—種扣除cDNA文庫,其通過權(quán)利要求55的方法產(chǎn)生。全文摘要提供了使用與自動(dòng)化測序系統(tǒng)相容的銜接子序列,用于使mRNA樣品高通量加工成cDNA文庫的新生物化學(xué)規(guī)程。所提供的方法生產(chǎn)沒有與目前cDNA文庫生產(chǎn)方法相關(guān)的3’偏倚的cDNA文庫。還提供了用于從DNA生產(chǎn)DNA文庫的新方法。文檔編號C12Q1/68GK101263227SQ200680034002公開日2008年9月10日申請日期2006年9月18日優(yōu)先權(quán)日2005年9月16日發(fā)明者D·A·威洛比,J·F·西蒙斯,S·K·哈奇森申請人:454生命科學(xué)公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1