專利名稱::合成編碼文庫的方法合成編碼文庫的方法相關(guān)申請本申請是2004年12月17日提交的未決的美國專利申請?zhí)?1/015458的部分繼續(xù)申請,該未決的申請與2003年12月17日提交的美國臨時專利申請序列號60/530854、2004年1月30日提交的美國臨時專利申請序列號60/540681、2004年3月15日提交的美國臨時專利申請序列號60/553,715和2004年7月16日提交的美國臨時專利申請序列號60/588,672相關(guān)。本申請也要求2005年6月9日提交的美國臨時專利申請序列號60/689,466和2005年10月28日提交的美國臨時專利申請序列號60/731,041的優(yōu)先權(quán)。上述申請的全部內(nèi)容均在此引入作為參考。發(fā)明背景探索鑒定具有有用生物活性的化合物的更有效方法,導(dǎo)致發(fā)展了篩選大量不同化合物的方法,這些化合物存在于被稱為組合文庫的集合中。這樣的文庫可含有105種或更多不同的化合物。有許多方法用于產(chǎn)生組合文庫,并且已經(jīng)報道了肽、擬肽和有機(jī)小分子的組合合成。組合方法應(yīng)用于藥物發(fā)現(xiàn)的兩個主要挑戰(zhàn)是非常復(fù)雜的文庫的合成和在所用篩選中有活性的分子的鑒定。通常知道文庫的復(fù)雜程度越高,即文庫中存在的不同結(jié)構(gòu)的數(shù)量越多,該文庫含有具有目標(biāo)活性的分子的可能性就越大。因此,文庫合成中使用的化學(xué)方法必須能夠在合理時間范圍內(nèi)生成大量化合物。但是對于給定的克式濃度和總濃度來說,提高文庫內(nèi)不同成員的數(shù)目降低了任何特定文庫成員的濃度。這使得從高復(fù)雜性文庫中鑒定活性分子變得復(fù)雜。克服這些障礙的一種方法是發(fā)展編碼文庫,特別是其中每個化合物均包含可擴(kuò)增標(biāo)簽的文庫。這樣的文庫包括DNA-編碼文庫,其中用于標(biāo)識文庫成員的DNA標(biāo)簽?zāi)軌蛴梅肿由飳W(xué)技術(shù)如聚合酶鏈反應(yīng)擴(kuò)增。但是,這些方法在產(chǎn)生很大文庫中的應(yīng)用尚未得到證明,顯然,為了實(shí)現(xiàn)該方法用于藥物發(fā)現(xiàn)的可能性,需要改進(jìn)產(chǎn)生這種文庫的方法。發(fā)明概述本發(fā)明提供一種合成包含編碼寡核苷酸標(biāo)簽的分子文庫的方法。該方法使用"分離-組合(splitandpool)"策略,其中將含有起始物的溶液分成("分離")多個部分,該起始物包括連接有一編碼寡核苷酸的第一結(jié)構(gòu)單元(buildingblock)。在每個部分中,起始物與獨(dú)特的第二結(jié)構(gòu)單元和標(biāo)識該第二結(jié)構(gòu)單元的獨(dú)特的第二寡核苷酸反應(yīng)。這些反應(yīng)可以同時或相繼進(jìn)行,如果是相繼進(jìn)行,則任一反應(yīng)都可以在另一反應(yīng)之前。將每個部分中產(chǎn)生的二聚體分子合并("組合,,),然后再分為多個部分。這些部分中的每一個然后與獨(dú)特的(部分特異性的)第三結(jié)構(gòu)單元和編碼該結(jié)構(gòu)單元的獨(dú)特的第三寡核苷酸反應(yīng)。產(chǎn)物文庫中存在的獨(dú)特分子的數(shù)目是以下數(shù)值的函數(shù)(l)在合成的每一步使用的不同結(jié)構(gòu)單元的數(shù)目,和(2)組合和分離步驟的重復(fù)次數(shù)。在一個實(shí)施方案中,本發(fā)明提供一種合成分子的方法,該分子包含與編碼寡核苷酸有效連接的功能部分或由如此連接的該功能部分組成。該方法包括下列步驟(l)提供由包含n個結(jié)構(gòu)單元的功能部分組成的起始化合物,其中n是1或大于1的整H其中該功能部分含有至少一個反應(yīng)基團(tuán),并且其中該功能部分與起始寡核苷酸有效連接;(2)將該起始化合物與包含至少一個互補(bǔ)反應(yīng)基團(tuán)的結(jié)構(gòu)單元反應(yīng),其中該至少一個互補(bǔ)反應(yīng)基團(tuán)與步驟(l)的反應(yīng)基團(tuán)互補(bǔ),反應(yīng)條件適合所述反應(yīng)基團(tuán)與互補(bǔ)反應(yīng)基團(tuán)反應(yīng)形成共價鍵;(3)將起始寡核苷酸與標(biāo)識步驟(b)的結(jié)構(gòu)單元的引入寡核香酸(incomingoligonucleotide)反應(yīng),反應(yīng)條件適合所述引入寡核香酸與起始寡核苷酸連接,并存在催化所述起始寡核苷酸與引入寡核苷酸連接的酶,從而產(chǎn)生包含功能部分或由該功能部分組成的分子,該功能部分含有n+l個結(jié)構(gòu)單元,并且與編碼寡核苷酸有效連接。如果步驟(3)的功能部分包含反應(yīng)基團(tuán),則步驟1-3可以重復(fù)一次或多次,從而形成循環(huán)1至i,其中i是2或大于2的整數(shù),循環(huán)S的步驟(3)的產(chǎn)物成為循環(huán)S+l的起始化合物,其中S是i-l或更小的整數(shù)。在一個實(shí)施方案中,本發(fā)明提供一種合成化合物文庫的方法,其中所述化合物包含功能部分,該功能部分包含兩個或更多的結(jié)構(gòu)單元,并且與標(biāo)識該功能部分的結(jié)構(gòu)的寡核苷酸有效連接。該方法包括下列步驟(l)提供包含m種起始化合物的溶液,其中m是l或大于1的整數(shù),其中起始化合物由包含n個結(jié)構(gòu)單元的功能部分組成,其中n是1或大于1的整數(shù),該功能部分與標(biāo)識該n個結(jié)構(gòu)單元的起始寡核苷酸有效連接;(2)將步驟(l)的溶液分成r個部分,其中r是2或大于2的整數(shù);(3)每個部分中的起始化合物與r個結(jié)構(gòu)單元之一反應(yīng),從而產(chǎn)生r個部分,這些部分包含由與起始寡核苷酸有效連接的功能部分組成的化合物,該功能部分包含n+l個結(jié)構(gòu)單元;(4)每個部分中的起始寡核苷酸與一組r個不同引入寡核苷酸之一反應(yīng),反應(yīng)條件適合所述引入寡核苷酸與起始寡核苷酸進(jìn)行酶連接,并存在催化所述引入寡核苷酸與起始寡核苷酸連接的酶,從而產(chǎn)生r個等份,這些等份包含由與延長的寡核苷酸有效連接的功能部分組成的分子,該功能部分包含n+l個結(jié)構(gòu)單元,該延長的寡核苷酸編碼該n+l個結(jié)構(gòu)單元。任選地,該方法可進(jìn)一步包括步驟(5):重新組合步驟(4)產(chǎn)生的r個部分,從而產(chǎn)生包含由功能部分組成的化合物的溶液,該功能部分包含n+l個結(jié)構(gòu)單元并且與延長的寡核苷酸有效連接。步驟(1)至(5)可以進(jìn)行一次或多次,以產(chǎn)生循環(huán)l至i,其中i是2或大于2的整數(shù)。在循環(huán)s+l中(其中s是i-l或更小的整數(shù)),步驟(l)的含有m種起始化合物的溶液是循環(huán)s的步驟(5)的溶液。同樣,循環(huán)s+l的步驟(l)的起始化合物是循環(huán)s的步驟(5)的化合物。在一個優(yōu)選實(shí)施方案中,在每一步驟中用常規(guī)化學(xué)反應(yīng)來偶聯(lián)結(jié)構(gòu)單元??梢詫⒔Y(jié)構(gòu)單元偶聯(lián)產(chǎn)生直鏈或分支聚合物或低聚物,如肽、擬肽和類肽,或非低聚物分子,如包含連接有一個或多個其他化學(xué)部分的支架結(jié)構(gòu)的分子。例如,如果結(jié)構(gòu)單元是氨基酸殘基,則該結(jié)構(gòu)單元可以用標(biāo)準(zhǔn)肽合成方法偶聯(lián),如本領(lǐng)域公知的、應(yīng)用適當(dāng)保護(hù)/脫保護(hù)策略的溶液相或固相合成。優(yōu)選地,結(jié)構(gòu)單元采用溶液相化學(xué)法偶聯(lián)。編碼寡核苷酸是單鏈或雙鏈寡核苷酸,優(yōu)選雙鏈寡核苦酸。編碼寡核苷酸優(yōu)選是每個結(jié)構(gòu)單元有4-12個堿基或堿基對的寡核苷酸;編碼寡核苷酸可以利用標(biāo)準(zhǔn)溶液相或固相寡核苷酸合成法偶聯(lián),但是優(yōu)選利用溶液相酶法偶聯(lián)。例如,如果編碼寡核苷酸的序列包含用于用一種這樣的酶進(jìn)行連接的起始序列的話,則該寡核苷酸可以利用拓樸異構(gòu)酶、連接酶或DNA聚合酶偶聯(lián)。編碼寡核苷酸的酶偶聯(lián)具有以下優(yōu)點(diǎn)(l)比標(biāo)準(zhǔn)合成(非酶)偶聯(lián)更高的添加精確度;和(2)應(yīng)用更簡單的保護(hù)/脫保護(hù)策略。另一方面,本發(fā)明提供式I的化合物<formula>formulaseeoriginaldocumentpage19</formula>(I)其中X是包含一個或多個結(jié)構(gòu)單元的功能部分;Z是在其3'末端與B連接的寡核苷酸;Y是在其5'末端與C連接的寡核苷酸;A是與X形成共價^t的官能團(tuán);B是與Z的3,-末端形成鍵的官能團(tuán);C是與Y的5'-末端形成鍵的官能團(tuán);D、F和E各自獨(dú)立地是雙功能連接基團(tuán);且S是原子或分子支架。這樣的化合物包括應(yīng)用本發(fā)明的方法合成的那些化合物。本發(fā)明進(jìn)一步涉及一種化合物文庫,其包含含有功能部分的化合物,該功能部分包含兩個或多個結(jié)構(gòu)單元,并且與編碼該功能部分結(jié)構(gòu)的寡核苷酸有效連接。這樣的文庫可包含約102至約1012或更多種不同的成員,例如102、103、104、105、106、107、108、109、1010、101)、102或更多不同的成員,即不同的分子結(jié)構(gòu)。在一個實(shí)施方案中,該化合物文庫包含各自獨(dú)立地為式I的化合<formula>formulaseeoriginaldocumentpage20</formula>(I)其中X是包含一個或多個結(jié)構(gòu)單元的功能部分;Z是在其3'末端與B連接的寡核苷酸;Y是在其5'末端與C連接的寡核苷酸;A是與X形成共價鍵的官能團(tuán);B是與Z的3,-末端形成鍵的官能團(tuán);C是與Y的5'-末端形成鍵的官能團(tuán);D、F和E各自獨(dú)立地是雙功能連接基團(tuán);且?guī)臁A硪环矫?,本發(fā)明提供一種鑒定與生物耙標(biāo)結(jié)合的化合物的方法,該方法包括以下步驟(a)使該生物靶標(biāo)接觸本發(fā)明的化合物文庫,其中該化合物文庫包括含有功能部分的化合物,該功能部分包含兩個或多個結(jié)構(gòu)單元,并且與編碼該功能部分的結(jié)構(gòu)的寡核苷酸有效連接。該步驟在適合化合物文庫的至少一個成員與該靶標(biāo)結(jié)合的條件下進(jìn)行;(2)除去不與該靶標(biāo)結(jié)合的文庫成員;(3)擴(kuò)增能與該靶標(biāo)結(jié)合的化合物文庫至少一個成員的編碼寡核苷酸;(4)對步驟(3)的編碼寡核苷酸進(jìn)行測序;和利用步驟(5)測定的序列確定能與該生物靶標(biāo)結(jié)合的化合物文庫成員的功能部分的結(jié)構(gòu)。本發(fā)明在鑒定具有所需性質(zhì)的分子方面具有幾個優(yōu)點(diǎn)。例如,本發(fā)明的方法允許在寡核苷酸標(biāo)簽的存在下使用許多化學(xué)反應(yīng)來構(gòu)建分子。本發(fā)明的方法也提供了向這樣產(chǎn)生的化學(xué)結(jié)構(gòu)中引入寡核苷酸標(biāo)簽的高保真度手段。另外,它們能夠合成具有高拷貝數(shù)的每個成員的文庫,從而允許對生物靶標(biāo)進(jìn)行多輪篩選,而在最后一輪后剩余足夠數(shù)量的分子用于寡核苷酸標(biāo)簽的擴(kuò)增和測序。附圖簡述圖1是雙鏈寡核普酸的連接的示意圖,其中起始寡核苷酸具有與引入寡核苷酸的突出端互補(bǔ)的突出端。起始鏈顯示為游離的、與氨基己基連接體偶聯(lián)的、或通過氨基己基連接體與苯丙氨酸殘基偶聯(lián)的。圖2是使用夾板(splint)鏈進(jìn)行寡核苷酸連接的示意圖。在該實(shí)施方案中,夾板是12-mer的寡核苷酸,其序列與單鏈起始寡核苷酸和單鏈引入寡核普酸互補(bǔ)。圖3是當(dāng)起始寡核苷酸是具有共價連接鏈的雙鏈,并且引入寡核苷酸是雙鏈時,起始寡核苷酸與引入寡核苷酸連接的示意圖。圖4是使用聚合酶延長寡核苷酸的示意圖。起始鏈表示為游離的、與氨基己基連接體偶聯(lián)的、或通過氨基己基連接體與苯丙氨酸殘基偶聯(lián)的。圖5是本發(fā)明的一個實(shí)施方案的合成循環(huán)的示意圖。圖6是應(yīng)用本發(fā)明的文庫進(jìn)行多輪篩選過程的示意圖。圖7是實(shí)施例1所述循環(huán)1至5中每一個的產(chǎn)物以及在封閉引物連接后的產(chǎn)物的電泳凝膠。分子量標(biāo)準(zhǔn)顯示于泳道l,用于DNA定量的hyperladder的指定量顯示于泳道9至12中。圖8是利用疊氮化物-炔環(huán)加成作用偶聯(lián)結(jié)構(gòu)單元的示意圖。圖9和圖IO說明通過氯代三溱上的親核芳族取代偶聯(lián)結(jié)構(gòu)單元。圖11顯示適合在功能部分合成中使用的代表性氯代雜芳環(huán)結(jié)構(gòu)。圖12說明應(yīng)用疊氮化物/炔環(huán)加成反應(yīng)環(huán)化直鏈肽。圖13A是如實(shí)施例2所述在循環(huán)4之后產(chǎn)生的文庫的層析圖。圖13B是如實(shí)施例2所述在循環(huán)4之后產(chǎn)生的文庫的質(zhì)譜圖。發(fā)明詳述本發(fā)明涉及制備化合物和組合化合物文庫的方法,通過本發(fā)明的方法制備的化合物和文庫,和利用該文庫鑒定具有所需性質(zhì)如所需生物活性的化合物的方法。本發(fā)明進(jìn)一步涉及應(yīng)用這些方法鑒定的化合物。已經(jīng)應(yīng)用了多種方法來產(chǎn)生和篩查組合化學(xué)文庫。例子包括將文庫的各成員彼此物理分離的方法,例如當(dāng)在多個反應(yīng)容器的每一個中合成單一化合物時。但是,這些文庫一般一次篩選一種化合物,或者最多一次篩選幾種化合物,因此不能獲得最有效的篩選過程。在另外一些方法中,在固體支持體上合成化合物。這樣的固體支持體包括芯片,其中特定化合物占據(jù)芯片或膜上的特定區(qū)域("可定位的位置")。在另外一些方法中,在珠上合成化合物,每個珠含有不同的化學(xué)結(jié)構(gòu)。在篩查大文庫時遇到的兩個困難是(l)可以篩選的不同化合物的數(shù)量;和(2)在篩選中有活性的化合物的鑒定。在一種方法中,在篩選中有活性的化合物如下鑒定將原始文庫縮小為更小的部分或亞部,在每種情況下都選擇含有活性化合物的部分或亞部,并且進(jìn)一步再分,直到獲得含有一組化合物的足夠小的活性亞部,以致該亞部的所有成員能夠單獨(dú)合成,并且評價所需的活性。這是一項(xiàng)單調(diào)的、費(fèi)時的工作。解析組合文庫篩查結(jié)果的另外一種方法是利用這樣的文庫,其中該文庫的成員用標(biāo)識標(biāo)簽進(jìn)行標(biāo)記,即,該文庫中存在的每個標(biāo)簽都與該文庫中存在的不同化合物結(jié)構(gòu)相關(guān),因此該標(biāo)簽的標(biāo)識指出了標(biāo)記分子的結(jié)構(gòu)。一種標(biāo)記文庫的方法使用寡核苷酸標(biāo)簽,如美國專利號5,573,905;5,708,153;5,723,598,6,060,596,公開的PCT申請WO93/06121;WO93/20242;WO94/13623;WO00/23458;WO02/074929和WO02/103008,Brenner和Lerner(Proc.Natl.Acad.Sci.USA89,5381-5383(1992);Nielsen和Janda(Methods:ACompaniontoMethodsinEnzymology6,361-371(1994);Nielsen,Brenner和Janda(J.Am.Chem.Soc.115,9812-9813(1993))所述,這些文獻(xiàn)均在此全文引用作為參考。這樣的標(biāo)簽可以利用如聚合酶鏈反應(yīng)擴(kuò)增,產(chǎn)生多個標(biāo)簽拷貝,并且通過測序鑒定該標(biāo)簽。標(biāo)簽的序列標(biāo)識了結(jié)合分子的結(jié)構(gòu),這些分子可以以純的形式合成并且檢測。本發(fā)明提供了產(chǎn)生DNA-編碼文庫的方法的改進(jìn),以及利用溶液相合成法合成功能部分的DNA編碼分子大(105個或更多成員的)文庫的首批實(shí)例。本發(fā)明提供了一種方法,該方法允許容易地合成寡核苷酸編碼的組合文庫,并且提供向大分子集合的每個成員上添加這種寡核苷酸標(biāo)簽的有效、高保真的手段。本發(fā)明的方法包括合成雙功能分子的方法,該雙功能分子包含由結(jié)構(gòu)單元組成的第一部分("功能部分"),和與第一部分有效連接的第二部分,第二部分包含標(biāo)識第一部分的結(jié)構(gòu)的寡核苷酸標(biāo)簽,即該寡核苷酸標(biāo)簽指示在第一部分構(gòu)建中使用了哪些結(jié)構(gòu)單元,以及結(jié)構(gòu)單元連接的順序。通常,寡核苷酸標(biāo)簽提供的信息足以確定用來構(gòu)建活性部分的結(jié)構(gòu)單元。在某些實(shí)施方案中,寡核苷酸標(biāo)簽的序列足以確定功能部分中結(jié)構(gòu)單元的排列,例如,對于擬肽,為氨基酸序列。如本文所用的術(shù)語"功能部分"是指包含一個或多個結(jié)構(gòu)單元的化學(xué)部分。優(yōu)選地,功能部分中的結(jié)構(gòu)單元不是核酸。功能部分可以是直鏈或支鏈或環(huán)形的聚合物或寡聚物或有機(jī)小分子。如本文所用的術(shù)語"結(jié)構(gòu)單元"是與其他化學(xué)結(jié)構(gòu)單位連接的,或者能夠與其他這樣的單位連接的化學(xué)結(jié)構(gòu)單位。當(dāng)功能部分是多聚的或寡聚的時,結(jié)構(gòu)單元是聚合物或寡聚物的單體單元。結(jié)構(gòu)單元也可以包括支架結(jié)構(gòu)("支架結(jié)構(gòu)單元,,),支架結(jié)構(gòu)上連接有或者可以連接一個或多個其他的結(jié)構(gòu)("周圍結(jié)構(gòu)單元")。應(yīng)當(dāng)理解,本文使用的術(shù)語"結(jié)構(gòu)單元"是指存在于功能部分中的,也指以反應(yīng)性形式用于合成功能部分的化學(xué)結(jié)構(gòu)單位。在功能部分內(nèi),結(jié)構(gòu)單元不含由于將該結(jié)構(gòu)單元摻入功能部分中而丟失的結(jié)構(gòu)單元的任何部分。例如,在鍵形成反應(yīng)釋放小分子的情況中(見下文),存在于功能部分中的結(jié)構(gòu)單元是"結(jié)構(gòu)單元?dú)埢?,即,在貢獻(xiàn)釋放分子的原子丟失后在合成中使用的結(jié)構(gòu)單元的剩余部分。結(jié)構(gòu)單元可以是互補(bǔ)的任何化學(xué)化合物,即結(jié)構(gòu)單元必須能夠一起反應(yīng),形成含有兩個或多個結(jié)構(gòu)單元的結(jié)構(gòu)。一般地說,使用的所有結(jié)構(gòu)單元都具有至少兩個反應(yīng)基團(tuán),盡管也可能有一些使用的結(jié)構(gòu)單元(例如在寡聚功能部分中的最后一個結(jié)構(gòu)單元)各自只含有一個反應(yīng)基團(tuán)。兩個不同結(jié)構(gòu)單元上的反應(yīng)基團(tuán)應(yīng)當(dāng)互補(bǔ),即,能夠一起反應(yīng)形成共價鍵,任選地伴隨小分子如水、HC1、HF等的丟失。為了本目的,如果兩個反應(yīng)基團(tuán)能夠一起反應(yīng)形成共價鍵,則它們互補(bǔ)。在一個優(yōu)選實(shí)施方案中,鍵形成反應(yīng)在環(huán)境條件下快速發(fā)生,基本不形成副產(chǎn)物。優(yōu)選地,特定反應(yīng)基團(tuán)與特定互補(bǔ)反應(yīng)基團(tuán)正好反應(yīng)一次。在一個實(shí)施方案中,兩個結(jié)構(gòu)單元的互補(bǔ)反應(yīng)基團(tuán)(例如)通過親核取代反應(yīng),形成共價睫。在一個實(shí)施方案中,一對互補(bǔ)反應(yīng)基團(tuán)的一個成員是親電子基團(tuán),而另一個成員是親核基團(tuán)?;パa(bǔ)親電子和親核基團(tuán)包括在適當(dāng)條件下通過親核取代反應(yīng)形成共價鍵的任何兩個基團(tuán)。許多合適的鍵形成反應(yīng)在本領(lǐng)域中公知。參見,例^口,March,AdvancedOrganicChemistry,第四片反,NewYork:JohnWileyandSons(1992),第10-16章;Carey和Sundberg,AdvancedOrganicChemistry,PartB,Plenum(1990),第1-11章;和Collman等,PrinciplesandApplicationsofOrganotmnsitionMetalChemistry,UniversityScienceBooks,MillValley,Calif.(1987),第13-20章;均在此全文引用作為參考。合適的親電子基團(tuán)的例子包括反應(yīng)性羰基,如酰氯基,酯基,包括羰基五氟苯酯和琥珀酰亞胺酯,酮基和醛基;反應(yīng)性磺?;缁酋B然?,和反應(yīng)性膦?;F渌H電子基團(tuán)包括末端環(huán)氧基、異氰酸酯基和烷基卣基團(tuán)。合適的親核基團(tuán)包括伯氨基、仲氨基、羥基和羧基。合適的互補(bǔ)反應(yīng)基團(tuán)在下面描述。本領(lǐng)域技術(shù)人員能夠容易地確定可在本方法中使用的其他反應(yīng)基團(tuán)對,本文提供的實(shí)例不是限制性的。在第一個實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)包括活化的羧基、反應(yīng)性磺?;蚍磻?yīng)性膦?;蛩鼈兊慕M合,和伯氨基或仲氨基。在該實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)在適當(dāng)條件下反應(yīng),形成酰胺、磺酰胺或磷酰胺鍵。在第二個實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)包括環(huán)氧基和伯氨基或仲氨基。含環(huán)氧化物的結(jié)構(gòu)單元與含胺的結(jié)構(gòu)單元在適當(dāng)條件下反應(yīng),形成碳-氮鍵,生成p-氨基醇。在另一個實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)包括吖丙啶基和伯氨基或仲氨基。在適當(dāng)條件下,含吖丙啶的結(jié)構(gòu)單元與含胺的結(jié)構(gòu)單元反應(yīng),形成碳-氮鍵,生成l,2-二胺。在第三個實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)包括異氰酸酯基和伯氨基或仲氨基。含異氰酸酯的結(jié)構(gòu)單元將與含胺的結(jié)構(gòu)單元在適當(dāng)條件下反應(yīng),形成碳-氮鍵,生成脲基。在第四個實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)包括異氰酸酯基和羥基。含異氰酸酯的結(jié)構(gòu)單元將與含羥基的結(jié)構(gòu)單元在適當(dāng)條件下反應(yīng),形成碳-氧鍵,生成氨基曱酸酯基。在第五個實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)包括氨基和含羰基的基團(tuán),如醛基或酮基。胺與這些基團(tuán)通過還原性胺化反應(yīng),形成新的碳-氮鍵。在第六個實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)包括磷葉立德基和醛基或酮基。含磷葉立德的結(jié)構(gòu)單元將與含醛或酮的結(jié)構(gòu)單元在適當(dāng)條件下反應(yīng),形成碳-碳雙鍵,生成烯。在第七個實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)通過環(huán)加成作用反應(yīng),形成環(huán)結(jié)構(gòu)。這樣的互補(bǔ)反應(yīng)基團(tuán)的一個例子是炔和有機(jī)疊氮化物,它們在適當(dāng)條件下反應(yīng),形成三唑環(huán)結(jié)構(gòu)。使用這種反應(yīng)連接兩個結(jié)構(gòu)單元的一個例子在圖8中顯示。用于這樣的反應(yīng)的適當(dāng)條件在本領(lǐng)域中公知,包括WO03/101972公開的那些,該專利的全部內(nèi)容在此引用作為參考。在第八個實(shí)施方案中,互補(bǔ)反應(yīng)基團(tuán)是烷基卣和親核基團(tuán),如氨基、羥基或羧基。這些基團(tuán)在適當(dāng)條件下反應(yīng),形成碳-氮(烷基卣加胺)或碳-氧(烷基由加羥基或羧基)。在第九個實(shí)施方案中,互補(bǔ)官能團(tuán)是由代雜芳基和親核基團(tuán),結(jié)構(gòu)單元在適當(dāng)條件下通過芳香親核取代連接。合適的閨代雜芳基包括氯代嘧啶、三。秦和。票呤,它們與親核物質(zhì)如胺在水溶液中在溫和條件下反應(yīng)。寡核苷酸標(biāo)記的三氯三嗪與胺反應(yīng)的代表性例子在圖9和10中顯示。合適的氯代雜芳基的例子在圖11中顯示??梢栽诒景l(fā)明分子和文庫合成中用來連接結(jié)構(gòu)單元的其他鍵形成反應(yīng)包括以下所示的那些。以下所示的反應(yīng)強(qiáng)調(diào)了反應(yīng)性官能團(tuán)。各種取代基可以存在于反應(yīng)物中,包括標(biāo)記的RpR2、R3和R4??梢员蝗〈目赡艿奈恢冒ǖ幌抻赗,、R2、R3和R4所示的位置。這些取代基可以包括任何合適的化學(xué)部分,但優(yōu)選地限于不千擾或不顯著抑制所述反應(yīng)的那些,除非另外說明,可以包括氬、烷基、取代的烷基、芳基、取代的芳基、雜芳基、取代的雜芳基、烷氧基、芳氧基、芳烷基、取代的芳烷基、氨基、取代的氨基、和本領(lǐng)域公知的其他基團(tuán)。這些基團(tuán)上的合適的取代基包括烷基、芳基、雜芳基、氰基、卣素、羥基、硝基、氨基、巰基、羧基和羧酰胺。當(dāng)說明時,合適的吸電子基團(tuán)包括硝基、羧基、卣代烷基如三氟曱基,和本領(lǐng)域公知的其他基團(tuán)。合適的供電子基團(tuán)的例子包括烷基、烷氧基、羥基、氨基、卣素、乙酰氨基和本領(lǐng)域公知的其他基團(tuán)。向鏈烯上添加伯胺<formula>formulaseeoriginaldocumentpage26</formula>Ugi縮合反應(yīng)<formula>formulaseeoriginaldocumentpage27</formula>親電子芳香取代反應(yīng)R1R2X是供電子基團(tuán)。亞胺/iminium/烯胺形成反應(yīng)<formula>formulaseeoriginaldocumentpage27</formula>環(huán)力口成反應(yīng)Diels-Alder環(huán)力口成<formula>formulaseeoriginaldocumentpage27</formula>1,3-二極性環(huán)加成,X-Y-Z=C-N-0,C-N-S,N3<formula>formulaseeoriginaldocumentpage27</formula>親核芳香取代反應(yīng)<formula>formulaseeoriginaldocumentpage28</formula>縮醛形成:<formula>formulaseeoriginaldocumentpage28</formula>合適的取代基X和Y的實(shí)例包括取代或未取代的氨基、取代或未取代的烷氧基、取代或未取代的硫代烷氧基、取代或未取代的芳氧基、和取代或未取代的硫代芳氧基。<formula>formulaseeoriginaldocumentpage28</formula>Heck反應(yīng)<formula>formulaseeoriginaldocumentpage29</formula>合適的取代基X和Y的實(shí)例包括取代和未取代的氨基、羥基和巰基;Y是連接X和Y的連接體,并且適合形成在反應(yīng)產(chǎn)物中發(fā)現(xiàn)的環(huán)結(jié)構(gòu)。醛醇反應(yīng):合適的:f又代基X的實(shí)例包括O、S和NR:可以用來形成本發(fā)明的分子和文庫的支架結(jié)構(gòu)單元包括具有兩個或多個官能團(tuán)的支架結(jié)構(gòu)單元,這些官能團(tuán)可能參加與周圍結(jié)構(gòu)單元前體的鍵形成反應(yīng),例如,利用上述一種或多種鍵形成反應(yīng)。支架部分也可以在構(gòu)建本發(fā)明的文庫和分子過程中合成,例如,利用可以以特定方式反應(yīng)形成含有附著有周圍官能團(tuán)的中心分子部分的分子的結(jié)構(gòu)單元前體。在一個實(shí)施方案中,本發(fā)明的文庫包含含有恒定支架部分、但是含有不同的周圍部分或不同的周圍部分排列的分子。在某些文庫中,所有文庫成員含有恒定支架部分;其他文庫也可以含有具有兩個或多個不同支架部分的分子??梢栽跇?gòu)建本發(fā)明的分子和文庫中使用的支架部分形成反應(yīng)的實(shí)例如表8所示。表中提到的參考文獻(xiàn)整體引入本文作為參考。對基團(tuán)R]、R2、113和R4僅有的限制是它們應(yīng)當(dāng)不干擾或不明顯抑制所述反應(yīng),可以包括氬、烷基、取代的烷基、雜烷基、取代的雜烷基、環(huán)烷基、雜環(huán)烷基、取代的環(huán)烷基、取代的雜環(huán)烷基、芳基、取代的芳基、芳烷基、雜芳烷基、取代的芳烷基、取代的雜芳烷基、雜芳基、取代的雜芳基、卣素、烷氧基、芳氧基、氨基、取代的氨基和本領(lǐng)域公知的其他基團(tuán)。合適的取代基包括但不限于烷基、烷氧基、硫代烷氧基、硝基、羥基、巰基、芳氧基、芳基-S-、卣素、羧基、氨基、烷基氨基、二烷基氨基、芳基氨基、氰基、氰酸酯、腈、異氰酸酯、硫氰酸酯、氨曱?;腿〈陌睍貂;?。應(yīng)當(dāng)理解,功能部分的合成可以通過一種特定類型的偶聯(lián)反應(yīng)進(jìn)行,例如但不限于以上所述反應(yīng)中的一種,或者通過兩種或多種偶聯(lián)反應(yīng)如以上所述的兩種或多種偶聯(lián)反應(yīng)的組合進(jìn)行。例如,在一個實(shí)施方案中,通過酰胺鍵形成(氨基和羧酸互補(bǔ)基團(tuán))和還原性胺化(氨基和醛或酮互補(bǔ)基團(tuán))的組合,將結(jié)構(gòu)單元連接在一起??梢允褂萌魏闻悸?lián)化學(xué)方法,只要它與寡核苦酸的存在相匹配。在本發(fā)明某些實(shí)施方案中使用的雙鏈(雙鏈體)寡核苷酸標(biāo)簽在化學(xué)上比單鏈標(biāo)簽更強(qiáng),因此,容許較寬的反應(yīng)條件范圍,并且能夠采用用單鏈標(biāo)簽不可能進(jìn)行的鍵形成反應(yīng)。除了反應(yīng)基團(tuán)或用于形成功能部分的基團(tuán)以外,結(jié)構(gòu)單元還可包含一個或多個官能團(tuán)。一個或多個這樣的其他官能團(tuán)可以受到保護(hù),以阻止這些官能團(tuán)的不需要的反應(yīng)。用于多種官能團(tuán)的合適的保護(hù)基在本領(lǐng)域中公知(Greene和Wuts,ProtectiveGroupsinOrganicSynthesis,第二版,NewYork:JohnWileyandSons(1991),在此引用作為參考)。特別有用的保護(hù)基包括叔丁基酯和醚、縮醛、三苯曱基醚和胺、乙酰基酯、三甲基硅烷基醚、三氯乙基醚和酯和氨基曱酸酯。在一個實(shí)施方案中,每個結(jié)構(gòu)單元都含有兩個反應(yīng)基團(tuán),這兩個反應(yīng)基團(tuán)可以相同也可以不同。例如,在循環(huán)s中添加的每個結(jié)構(gòu)單元可以包含兩個相同的反應(yīng)基團(tuán),但是它們均與步驟s-l和s+添加的結(jié)構(gòu)單元的反應(yīng)基團(tuán)互補(bǔ)。在另外一個實(shí)施方案中,每個結(jié)構(gòu)單元都含有兩個自身互補(bǔ)的反應(yīng)基團(tuán)。例如,包含聚酰胺分子的文庫可以通過含有兩個伯氨基的結(jié)構(gòu)單元與含有兩個活化羧基的結(jié)構(gòu)單元反應(yīng)產(chǎn)生。產(chǎn)生的化合物沒有N-末端或C-末端,因?yàn)榻惶娴孽0坊哂邢喾吹姆较蛐??;蛘?,聚酰胺文庫也可以用各自含有氨基和活化羧基的結(jié)構(gòu)單元產(chǎn)生。在該實(shí)施方案中,在循環(huán)的步驟n中添加的結(jié)構(gòu)單元具有游離的反應(yīng)基團(tuán),該反應(yīng)基團(tuán)與n-1結(jié)構(gòu)單元上可用的反應(yīng)基團(tuán)互補(bǔ),同時優(yōu)選地,第n個結(jié)構(gòu)單元上的另一反應(yīng)基團(tuán)受到保護(hù)。例如,如果該文庫的成員從C向N方向合成,則添加的結(jié)構(gòu)單元將包含活化的羧基和受到保護(hù)的氨基。功能部分可以是多聚或寡聚部分,如肽、擬肽、肽核酸或類肽,或者它們可以是非聚合的小分子,例如具有包含中央支架的結(jié)構(gòu)和繞支架周圍排列的結(jié)構(gòu)的分子。直鏈多聚或寡聚文庫通過使用具有兩個反應(yīng)基團(tuán)的結(jié)構(gòu)單元產(chǎn)生,而分支多聚或寡聚文庫通過使用具有三個或更多反應(yīng)基團(tuán)的結(jié)構(gòu)單元(任選地與只具有兩個反應(yīng)基團(tuán)的結(jié)構(gòu)單元組合)產(chǎn)生。這樣的分子可以表示為通式X!X2…Xn,其中每一個X都是含有n個單體單元的聚合物的單體單元,其中n是大于1的整數(shù)。對于寡聚或多聚化合物,末端結(jié)構(gòu)單元不需要含有兩個官能團(tuán)。例如,對于聚酰胺文庫,C-末端結(jié)構(gòu)單元可包含氨基,但是羧基的存在是任選的。類似地,N末端的結(jié)構(gòu)單元可包含羧基,但是不需要含有氨基。也可以合成分支寡聚或多聚化合物,只要至少一個結(jié)構(gòu)單元包含三個可與其他結(jié)構(gòu)單元反應(yīng)的官能團(tuán)。本發(fā)明的文庫可包含直鏈分子、支《連分子或它們的組合。也可以應(yīng)用如含有兩個或多個反應(yīng)基團(tuán)的支架結(jié)構(gòu)單元,與只具有一個可用反應(yīng)基團(tuán)的其他結(jié)構(gòu)單元組合,來構(gòu)建文庫,例如在任何其他反應(yīng)基團(tuán)被保護(hù)或者不與該支架結(jié)構(gòu)單元中存在的其他反應(yīng)基團(tuán)反應(yīng)時。在一個實(shí)施方案中,例如,合成的分子可以表示為通式X(Y)n,其中X是支架結(jié)構(gòu)單元;每個Y都是與X連接的結(jié)構(gòu)單元,n是至少為2的整數(shù),優(yōu)選2至大約6的整數(shù)。在一個優(yōu)選實(shí)施方案中,循環(huán)1的起始結(jié)構(gòu)單元是支架結(jié)構(gòu)單元。在通式X(Y)n的分子中,每個Y可以相同或不同,但是在典型文庫的大多數(shù)成員中,每個Y都將不同。在一個實(shí)施方案中,本發(fā)明的文庫包含聚酰胺化合物。聚酰胺化合物可以由來源于任何氨基酸的結(jié)構(gòu)單元組成,這些氨基酸包括20個天然存在的a-氨基酸,如丙氨酸(AIa;A)、甘氨酸(Gly;G)、天冬酰胺(Asn;N)、天冬氨酸(Asp;D)、谷氨酸(Glu;E)、姐氨酸(His;H)、亮氨酸(Leu;L)、賴氨酸(Lys;K)、苯丙氨酸(Phe;F)、酪氨酸(Tyr;Y)、蘇氨酸(Thr;T)、絲氨酸(Ser;S)、精氨酸(Arg;R)、纈氨酸(Val;V)、谷氨酰胺(Gln;Q)、異亮氨酸(Ile;I)、半胱氨酸(Cys;C)、曱硫氨酸(Met;M)、脯氨酸(Pro;P)和色氨酸(Trp;W),其中給出了每個氨基酸的三字母和單字母編碼。在它們的天然存在的形式中,上述每個氨基酸都以L-構(gòu)型存在,除非另外指出,本文中即這樣假設(shè)。但是在本方法中,也可以-使用這些氨基酸的D-構(gòu)型形式。這些D-氨基酸在本文中用小寫三字母或單字母編碼表示,即,ala(a)、gly(g)、leu(1)、gln(q)、thr(t)、ser(s)等。結(jié)構(gòu)單元也可以來源于其他a-氨基酸,包括但不限于3-芳基丙氨酸,如萘基丙氨酸、苯基取代的苯丙氨酸,包括4-氟-、4-氯、4-溴和4-曱基苯丙氨酸;3-雜芳基丙氨酸,如3-吡啶基丙氨酸、3-噻吩基丙氨酸、3-喹啉基丙氨酸和3-咪唑基丙氨酸;鳥氨酸;瓜氨酸;高瓜氨酸;肌氨酸;高脯氨酸;高半胱氨酸;取代的脯氨酸,如羥脯氨酸和氟脯氨酸;脫氫脯氨酸;正亮氨酸;O-曱基酪氨酸;O-曱基絲氨酸;0-曱基蘇氨酸和3-環(huán)己基丙氨酸。上述每個氨基酸都可以以D-或L-構(gòu)型使用。結(jié)構(gòu)單元也可以是非a-氨基酸的氨基酸,如a-氮雜氨基酸;P,y,5,g-氨基酸,和N-取代的氨基酸,如N-取代的甘氨酸,其中N-取代基可以是(例如)取代的或未取代的烷基、芳基、雜芳基、芳烷基或雜芳烷基。在一個實(shí)施方案中,N-取代基是來自天然存在的或非天然存在的oc-氨基酸的側(cè)鏈。結(jié)構(gòu)單元也可以是擬肽結(jié)構(gòu),如二肽、三肽、四肽或五肽模擬物。這樣的擬肽結(jié)構(gòu)單元優(yōu)選地來源于氨基?;衔?,使得將這些結(jié)構(gòu)單元添加到正在延長的聚(氨基?;?上的化學(xué)與用于其他結(jié)構(gòu)單元的化學(xué)相同或相似。結(jié)構(gòu)單元也可以是能夠形成與肽鍵電子等排的鍵的分子,以形成包含肽骨架修飾的擬肽功能部分,如\k[CH2S]、\)/[CH2NH]、\|/[CSNH2]、\|/[NHCO]、v[COCH2]和x)/[(E)或(Z)CHK:H]。在以上使用的命名中,n/表示不存在酰胺鍵。代替酰胺基的結(jié)構(gòu)在括號內(nèi)指出。在一個實(shí)施方案中,本發(fā)明提供一種合成化合物的方法,該化合物包含與編碼寡核苷酸有效連接的功能部分或由如此連接的該功能部分組成。該方法包括下列步驟(l)提供由包含n個結(jié)構(gòu)單元的起始功能部分組成的起始化合物,其中n是1或大于1的整數(shù),其中該起始功能部分含有至少一個反應(yīng)基團(tuán),并且其中該起始功能部分與編碼n個結(jié)構(gòu)單元的起始寡核苷酸有效連接;(2)將該起始化合物與包含至少一個互補(bǔ)反應(yīng)基團(tuán)的結(jié)構(gòu)單元反應(yīng),其中該至少一個互補(bǔ)反應(yīng)基團(tuán)與步驟(l)的反應(yīng)基團(tuán)互補(bǔ),反應(yīng)條件適合所述反應(yīng)基團(tuán)與互補(bǔ)反應(yīng)基團(tuán)反應(yīng)形成共價鍵;(3)將起始寡核苷酸與引入寡核普酸反應(yīng),反應(yīng)條件適合所述引入寡核苷酸與起始寡核苷酸連接,并存在催化所述起始寡核苷酸與引入寡核苷酸連接的酶,從而產(chǎn)生包含功能部分或由該功能部分組成的分子,該功能部分含有n+l個結(jié)構(gòu)單元,并且與編碼寡核苷酸有效連接。如果步驟(3)的功能部分包含反應(yīng)基團(tuán),則步驟1-3可以重復(fù)一次或多次,從而形成循環(huán)1至i,其中i是2或大于2的整數(shù),循環(huán)s-l的步驟(3)的產(chǎn)物成為循環(huán)s的步驟(l)的起始化合物,其中s是i或更小的整數(shù)。在每個循環(huán)中,一個結(jié)構(gòu)單元添加到正在延長的功能部分上,并且編碼新結(jié)構(gòu)單元的一個寡核苷酸序列添加到正在延長的編碼寡核苷酸上。在一個實(shí)施方案中,通過使第一結(jié)構(gòu)單元與寡核苷酸(例如,包括PCR引物序列或起始寡核苷酸的寡核苷酸)或與連接有這種寡核苷酸的連接體反應(yīng)而產(chǎn)生最初的起始化合物。在圖5所示的實(shí)施方案中,連接體包含用于連接第一結(jié)構(gòu)單元的反應(yīng)基團(tuán),并且連接到起始寡核苷酸上。在該實(shí)施方案中,結(jié)構(gòu)單元(或在多個等份的每一個中,結(jié)構(gòu)單元集合中的一個)與連接體的反應(yīng)基團(tuán)的反應(yīng)以及向起始寡核苷酸上添加編碼結(jié)構(gòu)單元的寡核苷酸產(chǎn)生上述過程的一種或多種最初的起始化合物。在一個優(yōu)選實(shí)施方案中,每個單個結(jié)構(gòu)單元與不同的寡核苷酸相關(guān)聯(lián),使得在特定循環(huán)中添加的寡核苷酸中的核苷酸序列標(biāo)識在同一循環(huán)中添加的結(jié)構(gòu)單元。結(jié)構(gòu)單元的偶聯(lián)和寡核苷酸的連接通常在相似濃度的起始材料和試劑中發(fā)生。例如,為了使結(jié)構(gòu)單元有效偶聯(lián),優(yōu)選約為微摩爾至毫摩爾級例如約lOiaM至約10mM的反應(yīng)物濃度。在某些實(shí)施方案中,該方法在步驟(2)之后進(jìn)一步包括清除任何未反應(yīng)的起始功能部分的步驟。清除特定循環(huán)中任何未反應(yīng)的起始功能部分防止了該循環(huán)的起始功能部分與后一循環(huán)中添加的結(jié)構(gòu)單元反應(yīng)。這樣的反應(yīng)可導(dǎo)致產(chǎn)生丟失了一個或多個結(jié)構(gòu)單元的功能部分,可能產(chǎn)生對應(yīng)于特定寡核苷酸序列的一系列功能部分結(jié)構(gòu)。這種清除可以通過任何剩余的起始功能部分與可與步驟(2)的反應(yīng)基團(tuán)反應(yīng)的化合物進(jìn)行反應(yīng)來實(shí)現(xiàn)。優(yōu)選地,清除化合物與步驟(2)的反應(yīng)基團(tuán)快速反應(yīng),并且不含能夠與后一循環(huán)中添加的結(jié)構(gòu)單元反應(yīng)的另外的反應(yīng)基團(tuán)。例如,在其中步驟(2)的反應(yīng)基團(tuán)是氨基的化合物合成中,適合的清除化合物是N-羥基琥珀酰亞胺酯,如乙酸N-羥基琥珀酰亞胺酯。在另一實(shí)施方案中,本發(fā)明提供一種制備化合物文庫的方法,其中每個化合物都包含功能部分,該功能部分包含兩個或多個結(jié)構(gòu)單元?dú)埢?,并且與寡核苷酸有效連接。在一個優(yōu)選實(shí)施方案中,每個分子中存在的寡核苷酸提供了足以標(biāo)識該分子內(nèi)的結(jié)構(gòu)單元和任選的結(jié)構(gòu)單元添加順序的信息。在該實(shí)施方案中,本發(fā)明的方法包括一種合成化合物文庫的方法,其中該化合物包含功能部分,該功能部分包括兩個或多個結(jié)構(gòu)單元,并且與標(biāo)識該功能部分結(jié)構(gòu)的寡核苷酸有效連接。該方法包括步驟(l)提供包含m種起始化合物的溶液,其中m是1或大于1的整數(shù),其中起始化合物由包含n個結(jié)構(gòu)單元的功能部分組成,其中n是1或大于1的整數(shù),該功能部分與標(biāo)識該n個結(jié)構(gòu)單元的起始寡核苷酸有效連接;(2)將步驟(1)的溶液分配為至少r個部分,其中r是2或大于2的整數(shù);(3)將每個部分與r個結(jié)構(gòu)單元之一反應(yīng),從而產(chǎn)生r個部分,該r個部分包含由功能部分組成的化合物,該功能部分包含n+l個結(jié)構(gòu)單元,并且與起始寡核苷酸有效連接;(4)將步驟(3)的r個部分中的每一個與一組r個不同引入寡核苷酸之一反應(yīng),反應(yīng)條件適合所述引入寡核苷酸與起始寡核苦酸發(fā)生酶連接,從而產(chǎn)生r個部分,該部分包含由功能部分組成的分子,該功能部分包含n+l個結(jié)構(gòu)單元,并且與編碼該n+l個結(jié)構(gòu)單元的延長的寡核苷酸有效連接。任選地,該方法可進(jìn)一步包括步驟(5)重新組合步驟(4)中產(chǎn)生的r個部分,從而產(chǎn)生包含由功能部分組成的分子的溶液,該功能部分包含n+l個結(jié)構(gòu)單元,并且與編碼該n+l個結(jié)構(gòu)單元的延長的寡核苷酸有效連接。步驟(1)至(5)可以進(jìn)行一次或多次,以產(chǎn)生循環(huán)l至i,其中i是2或大于2的整數(shù)。在循環(huán)S+l中(其中S是i-l或更小的整數(shù)),步驟(l)的含有m種起始化合物的溶液是循環(huán)s的步驟(5)的溶液。同樣,循環(huán)s+l的步驟(l)的起始化合物是循環(huán)s的步驟(4)的產(chǎn)物。優(yōu)選地,在文庫合成的每個循環(huán)中將步驟(2)的溶液分成r個部分。在該實(shí)施方案中,每個部分與獨(dú)特結(jié)構(gòu)單元反應(yīng)。在本發(fā)明的方法中,結(jié)構(gòu)單元和引入寡核苷酸的添加順序不是關(guān)鍵,分子合成的步驟(2)和(3),和文庫合成中的步驟(3)和(4)可以顛倒,即在添加新結(jié)構(gòu)單元之前,引入寡核苷酸可以與起始寡核苷酸連接。在某些實(shí)施方案中,可以同時進(jìn)行這兩個步驟。在某些實(shí)施方案中,該方法在步驟(2)之后進(jìn)一步包括清除任何未反應(yīng)的起始功能部分的步驟。清除特定循環(huán)中任何未反應(yīng)的起始功能部分防止了該循環(huán)的起始功能部分與后一循環(huán)中添加的結(jié)構(gòu)單元反應(yīng)。這樣的反應(yīng)可導(dǎo)致產(chǎn)生丟失了一個或多個結(jié)構(gòu)單元的功能部分,可能產(chǎn)生對應(yīng)于特定寡核苷酸序列的一系列功能部分結(jié)構(gòu)。這種清除可以通過任何剩余的起始功能部分與可與步驟(2)的反應(yīng)基團(tuán)反應(yīng)的化合物進(jìn)行反應(yīng)來實(shí)現(xiàn)。優(yōu)選地,清除化合物與步驟(2)的反應(yīng)基團(tuán)快速反應(yīng),并且不含能夠與后一循環(huán)中添加的結(jié)構(gòu)單元反應(yīng)的另外的反應(yīng)基團(tuán)。例如,在其中步驟(2)的反應(yīng)基團(tuán)是氨基的化合物合成中,適合的清除化合物是N-羥基琥銷酰亞胺酯,如乙酸N-羥基琥珀酰亞胺酯。在一個實(shí)施方案中,通過評價候選結(jié)構(gòu)單元與適當(dāng)互補(bǔ)官能團(tuán)在用于合成文庫的條件下反應(yīng)的能力,從一組候選結(jié)構(gòu)單元中選擇文庫合成單元,用于引入文庫中。任選地可以純化特定循環(huán)的產(chǎn)物。當(dāng)循環(huán)是中間循環(huán),即,最終循環(huán)之前的任何循環(huán)時,這些產(chǎn)物是中間產(chǎn)物,可以在下一循環(huán)開始前純化。如果該循環(huán)是最后一次循環(huán),則該循環(huán)的產(chǎn)物是終產(chǎn)物,可以在該化合物的任何應(yīng)用前純化。該純化步驟可以例如除去未反應(yīng)的或過量的反應(yīng)物和用于寡核苷酸連接的酶??梢允褂眠m合將產(chǎn)物與溶液中存在的其他物質(zhì)進(jìn)行分離的任何方法,包括液相色語,如高效液相色譜(HPLC),和用合適的共溶劑如乙醇沉淀。合適的純化方法依賴于產(chǎn)物的性質(zhì)和用于合成的溶劑系統(tǒng)。反應(yīng)優(yōu)選地在水溶液如緩沖水溶液中進(jìn)行,但是也可以在與結(jié)構(gòu)單元、寡核苷酸、中間產(chǎn)物和終產(chǎn)物的溶解性質(zhì)和用于催化寡核香酸連接的酶相匹配的混合水/有機(jī)介質(zhì)中進(jìn)行。中使用的不同起始化合物的數(shù)目m與循環(huán)中添加的不同結(jié)構(gòu)單元的數(shù)目r的積。循環(huán)中產(chǎn)生的不同化合物的實(shí)際數(shù)目可以高達(dá)r和m的積(rxm),但是如果某些結(jié)構(gòu)單元與某些其他結(jié)構(gòu)單元的反應(yīng)性有差異的話,則可能較低。例如,向特定起始化合物上添加特定結(jié)構(gòu)單元的動力學(xué)可能是,在合成循環(huán)的時間尺度上,可能產(chǎn)生很少的反應(yīng)產(chǎn)物,甚至不產(chǎn)生產(chǎn)物。在某些實(shí)施方案中,在循環(huán)1之前、最后一次循環(huán)之后或任意兩次循環(huán)之間加入通用結(jié)構(gòu)單元。例如,當(dāng)功能部分是聚酰胺時,可以在最后一次循環(huán)后加入通用N-末端加帽結(jié)構(gòu)單元。也可以在任意兩個循環(huán)之間引入通用結(jié)構(gòu)單元,例如添加官能團(tuán),如炔基或疊氮基,它們可以在文庫合成后例如通過環(huán)化用來修飾功能部分。如本文所用的術(shù)語"有效連接,,是指兩個化學(xué)結(jié)構(gòu)以一種方式連接在一起,使得它們經(jīng)受預(yù)期的各種操作后仍保持連接。一般來說,功能部分和編碼寡核苷酸通過合適的連接基團(tuán)共價連接。該連接基團(tuán)是具有寡核苷酸連接部位和功能部分連接部位的二價部分。例如,當(dāng)功能部分是聚酰胺化合物時,該聚酰胺化合物可以與連接基團(tuán)在其N-末端、C-末端或通過一個側(cè)鏈上的官能團(tuán)連接。該連接基團(tuán)足以通過至少一個原子,優(yōu)選一個以上原子,如至少兩個、至少三個、至少四個、至少五個或至少六個原子,分隔聚酰胺化合物和寡核香酸。優(yōu)選地,該連接基團(tuán)具有充分的柔性,可使聚酰胺化合物與靶分子以不依賴于該寡核苷酸的方式結(jié)合。在一個實(shí)施方案中,連接基團(tuán)與聚酰胺化合物的N-末端和寡核苷酸的5,-磷酸基連接。例如,連接基團(tuán)可以來源于在一個末端上含有活化羧基而在另一末端上含有活化酯的連接基團(tuán)前體。連接基團(tuán)前體與N-末端氮原子的反應(yīng)將形成一個酰胺鍵,將該連接基團(tuán)與聚酰胺化合物或N-末端結(jié)構(gòu)單元連接在一起,而連接基團(tuán)前體與寡核苷酸的5,-羥基的反應(yīng)將導(dǎo)致寡核苷酸與連接基團(tuán)通過酯鍵連接。連接基團(tuán)可包括,例如聚亞甲基鏈,如-(CH2)n-鏈,或聚(乙二醇)鏈,如-(CH2CH20)n鏈,其中在兩種情況中,n都是l至約20的整數(shù)。優(yōu)選地,n為2至約12,更優(yōu)選約4至約10。在一個實(shí)施方案中,連接基團(tuán)包括環(huán)己基(-(CH2)6-)。當(dāng)結(jié)構(gòu)單元是氨基酸殘基時,得到的功能部分是聚酰胺??梢岳糜糜谛纬甚0锋I的任何合適的化學(xué)方法將氨基酸偶聯(lián)。優(yōu)選地,氨基酸結(jié)構(gòu)單元的偶聯(lián)在與寡核苷酸的酶連接相匹配的條件下進(jìn)行,例如在中性或接近中性的pH和水溶液中進(jìn)行。在一個實(shí)施方案中,聚酰胺化合物以C-末端到N-末端的方向合成。在該實(shí)施方案中,第一個或者C-末端的結(jié)構(gòu)單元在其羧基處與寡核苷酸通過合適的連接基團(tuán)連接。第一個結(jié)構(gòu)單元與第二個結(jié)構(gòu)單元反應(yīng),第二個結(jié)構(gòu)單元優(yōu)選具有活化的羧基和受到保護(hù)的氨基。可以使用適合溶液相酰胺鍵形成的任何活化/保護(hù)基團(tuán)策略。例如,合適的活化羧基類型包括酰氟(美國專利號5,360,928,在此全文引用作為參考)、對稱酸肝和N-羥基琥珀酰亞胺酯。如本領(lǐng)域所知,通過與合適的活化化合物反應(yīng),?;部梢栽谠换罨:线m的活化化合物包括二環(huán)己基碳二亞胺(DCC)、二異丙基碳二亞胺(DIC)、1-乙氧羰基-2-乙氧基-1,2-二氫喹啉(EEDQ)、1-乙基-3-(3-二曱基氨丙基)碳二亞胺鹽酸鹽(EDC)、正丙烷-膦酸酐(PPA)、N,N-二(2-氧-3-噁唑烷基)亞氨基-磷酰氯(BOP-Cl)、溴-三-卩比咯烷基磷六氟磷酸(PyBrop)、二苯基磷?;B氮化物(DPPA)、Castro's試劑(BOP,PyBop)、O-苯并三唑基-N,N,N',N'-四甲基脲鹽(HBTU)、二乙基磷酰氰(DEPCN)、2,5-聯(lián)苯基-2,3-二氬_3-氧—4-羥基-噻吩二氧化物(Steglich's試劑;HOTDO)、l,l'-羰基-二咪唑(CDI)和4-(4,6-二曱氧基-1,3,5-三嗪-2-基)-4-曱基嗎啉氯(DMT-MM)。偶聯(lián)試劑可以單獨(dú)使用或者與諸如N,N-二曱基-4-氨基吡啶(DMAP)、N-羥基-苯并三唑(HOBt)、N-羥基苯并三嗪(HOOBt)、N-羥基琥珀酰亞胺(HOSu)、N-羥基氮雜苯并三唑(HOAt)、氮雜苯并三唑基-四曱基脲鹽(HATU,HAPyU)或2-羥基吡啶等添加劑組合使用。在某些實(shí)施方案中,文庫的合成需要使用兩個或多個活化策略,以能夠使用結(jié)構(gòu)上多樣化的一組結(jié)構(gòu)單元。對于每個結(jié)構(gòu)單元,本領(lǐng)域技術(shù)人員能夠確定合適的活化策略。N末端保護(hù)基可以是與該方法的條件相匹配的任何保護(hù)基,例如,適合溶液相合成條件的保護(hù)基。一種優(yōu)選的保護(hù)基是藥曱氧羰基("Fmoc")。氨酰基結(jié)構(gòu)單元側(cè)鏈上的任何潛在反應(yīng)性官能團(tuán)也可能需要適當(dāng)保護(hù)。優(yōu)選地,側(cè)鏈保護(hù)基與N末端保護(hù)基正交,即,在不同于除去N末端保護(hù)基所需條件的條件下除去該側(cè)鏈保護(hù)基。合適的側(cè)鏈保護(hù)基包括硝基藜,基,它可以用來既保護(hù)側(cè)鏈羧基又保護(hù)側(cè)鏈氨基。另外一種合適的側(cè)鏈胺保護(hù)基是N-戊-4-烯?;?。結(jié)構(gòu)單元可以在摻入功能部分后修飾,例如,通過涉及一個或多個結(jié)構(gòu)單元上的官能團(tuán)的適當(dāng)反應(yīng)進(jìn)行。結(jié)構(gòu)單元修飾可以在添加最后一個結(jié)構(gòu)單元后發(fā)生,或者在功能部分合成的任一中間點(diǎn)發(fā)生,例如,在合成過程的任一循環(huán)后發(fā)生。當(dāng)合成本發(fā)明的雙功能分子文庫時,可以對整個文庫或文庫的一部分進(jìn)行結(jié)構(gòu)單元修飾,從而提高文庫的復(fù)雜程度。合適的結(jié)構(gòu)單元修飾反應(yīng)包括可以在與功能部分和編碼寡核苷酸相匹配的條件下進(jìn)行的那些反應(yīng)。這樣的反應(yīng)的例子包括氨基或羥基的?;突腔?、氨基的烷基化、羧基的酯化或硫酯化、羧基的酰胺化、烯的環(huán)氧化和本領(lǐng)域公知的其他反應(yīng)。當(dāng)功能部分包括含有炔或疊氮官能團(tuán)的結(jié)構(gòu)單元時,可以利用疊氮/炔的環(huán)加成反應(yīng)衍生化該結(jié)構(gòu)單元。例如,包含炔的結(jié)構(gòu)單元可與有機(jī)疊氮化物反應(yīng),或者包含疊氮的結(jié)構(gòu)單元可與炔反應(yīng),在任一種情況下都形成三唑。結(jié)構(gòu)單元修飾反應(yīng)可以在添加最后一個結(jié)構(gòu)單元后發(fā)生,或者在合成過程的中間點(diǎn)處發(fā)生,并且能夠用來向功能部分上添加多種化學(xué)結(jié)構(gòu),包括碳水化合物、金屬結(jié)合部分和用于靶向某些生物分子或組織類型的結(jié)構(gòu)。在另一個實(shí)施方案中,功能部分包含一系列直鏈結(jié)構(gòu)單元,該直鏈系列利用適當(dāng)?shù)姆磻?yīng)環(huán)化。例如,如果直鏈排列的至少兩個結(jié)構(gòu)單元包括巰基,則可以將巰基氧化形成二硫鍵,從而環(huán)化該直鏈系列。-例如,功能部分可以是包含兩個或多個L或D-半胱氨酸和/或L或D-高半胱氨酸部分的寡肽。結(jié)構(gòu)單元也可以包含能夠一起反應(yīng)環(huán)化直鏈系列的其他官能團(tuán),如羧基和氨基或羥基。在一個優(yōu)選實(shí)施方案中,直鏈系列中的一個結(jié)構(gòu)單元包含炔基,而直鍵系列中的另一個結(jié)構(gòu)單元包含疊氮基。可以誘導(dǎo)疊氮基和炔基通過環(huán)加成作用反應(yīng),導(dǎo)致形成大環(huán)結(jié)構(gòu)。在圖9所示的實(shí)施例中,功能部分是在C末端包含炔丙基甘氨酸結(jié)構(gòu)單元而在N末端包含疊氮基乙?;亩嚯摹H不c疊氮基在適當(dāng)條件下的反應(yīng)導(dǎo)致環(huán)狀化合物的形成,該化合物包括大環(huán)內(nèi)的三唑結(jié)構(gòu)。對于文庫的情況,在一個實(shí)施方案中,文庫的每個成員都包含含炔和疊氮基的結(jié)構(gòu)單元,并且可以以這種方式環(huán)化。在第二個實(shí)施方案中,文庫的所有成員都包含含炔和疊氮基的結(jié)構(gòu)單元,但是只有文庫的一部分環(huán)化。在第三個實(shí)施方案中,只有某些功能部分包含含炔和疊氮基的結(jié)構(gòu)單元,并且只有這些分子環(huán)化。在上述第二個和第三個實(shí)施方案中,該文庫在環(huán)加成反應(yīng)后既包含環(huán)狀功能部分也包含直鏈功能部分。在其中在特定合成步驟過程中向文庫的每個和全部部分中添加相同的功能部分例如三噪的一些實(shí)施方案中,可能不必添加編碼該功能部分的寡核普酸標(biāo)簽。寡核苷酸可以通過化學(xué)或酶法連接。在一個實(shí)施方案中,寡核苷酸可以通過化學(xué)方法連接。DNA和RNA的化學(xué)連接可以如Shabarova等人(1991)NucleicAcidsResearch,19,4247-4251,Federova等人(1996)NucleosidesandNucleotides,15,1137-1147,和Carriero和Damha(2003)JournalofOrganicChemistry,68,8328-8338所教導(dǎo)的使用諸如水溶性碳二亞胺和溴化氰的試劑進(jìn)行。在一個實(shí)施方案中,使用比例為1:lOv/v的乙腈中的5M溴化氰和pH7.6緩沖液(1MMES+20mMMgCl2)中的5,磷酸化寡核苷酸,在O'C下進(jìn)行化學(xué)連接1-5分鐘。在另一實(shí)施方案中,寡核苷酸使用酶法連接。在任一實(shí)施方案中,寡核苷酸都可以是雙鏈的,優(yōu)選地具有約5個到約14個堿基的突出端。寡核苷酸也可以是單鏈的,在該情況中,用與將要連接的每一寡核苷酸有大約6個堿基重疊的夾寺反(splint)纟皮此靠近地定位反應(yīng)性5,和3'部分。在一個實(shí)施方案中,起始結(jié)構(gòu)單元與起始寡核苷酸有效連接。在第二結(jié)構(gòu)單元與起始結(jié)構(gòu)單元偶聯(lián)之前或之后,標(biāo)識第二結(jié)構(gòu)單元的第二寡核苷酸序列與起始寡核苷酸連接。用于連接起始寡核苷酸序列和引入寡核苷酸序列的方法在圖1和圖2中描述。在圖1中,起始寡核苷酸是雙鏈,一條鏈包含與第二寡核苷酸的一個末端互補(bǔ)的突出端序列,并且使第二寡核苷酸接觸起始寡核苷酸。優(yōu)選地,起始寡核苷酸的突出序列和第二寡核苷酸的互補(bǔ)序列都為至少約4個石成基;更優(yōu)選地兩個序列長度相同??梢杂煤线m的酶將起始寡核苷酸和第二寡核苷酸連接起來。如果起始寡核苷酸在一條鏈("頂鏈")的5'末端與第一結(jié)構(gòu)單元連接,則與該頂鏈互補(bǔ)的鏈("底鏈,,)將在其5,末端包含突出端序列,第二寡核苷酸將在其5,末端包含互補(bǔ)序列。在第二寡核苷酸連接后,可以添加與第二寡核苷酸的序列互補(bǔ)的一條鏈,其位于突出端互補(bǔ)序列的3'方向,并且包含另外的突出端序列。在一個實(shí)施方案中,寡核苷酸如圖2所示延長。定位與正在延長的功能部分結(jié)合的寡核苷酸和?1入寡核苷酸,用于利用"夾板"序列連接,該序列包括與起始寡核苷酸的3'末端互補(bǔ)的區(qū)域和與引入寡核苷酸的5,末端互補(bǔ)的區(qū)域。夾板使寡核苷酸的5,末端靠近引入寡核苦酸的3,末端,并且利用酶連接完成連接。在圖2所示的實(shí)施例中,起始寡核苷酸由16個核堿基組成,夾板與3,末端的6個堿基互補(bǔ)。引入寡核苷酸由12個核堿基組成,夾板與5'末端的6個堿基互補(bǔ)。夾板的長度和互補(bǔ)區(qū)的長度不是關(guān)鍵的。但是,互補(bǔ)區(qū)應(yīng)當(dāng)足夠長,以便在連接條件下能夠形成穩(wěn)定的二聚體,而不是在終分子中產(chǎn)生過大的編碼核苷酸?;パa(bǔ)區(qū)的長度優(yōu)選為約4個堿基至約12個堿基,更優(yōu)選約5個堿基至約10個堿基,最優(yōu)選約5個堿基至約8個堿基。用于本文所述的文庫合成方法的分離-組合法確保每個獨(dú)特的功能部分與至少一個標(biāo)識該功能部分的獨(dú)特的寡核苷酸序列有效連接。如果在至少一個合成循環(huán)中至少一個結(jié)構(gòu)單元使用2種或多種不同的寡核苷酸標(biāo)簽,則包含該結(jié)構(gòu)單元的每個不同的功能部分將由多種寡核苷酸編碼。例如,如果在合成4循環(huán)文庫過程中每個結(jié)構(gòu)單元使用2種寡核序列(24)編碼每個獨(dú)特功能部分。用多種序列編碼每個獨(dú)特功能部分具有幾個潛在的優(yōu)點(diǎn)。首先,編碼相同功次,編碼相同功能部分的標(biāo)簽序列的不同組合的選擇消除了該選擇基于寡核苷酸序列的可能性。第三,如果序列分析提示特定功能部分高度富集,但是在多種可能性中只出現(xiàn)一種序列組合,則可以認(rèn)為是技術(shù)上的人工產(chǎn)物。多重標(biāo)記可以通過使獨(dú)立的分反應(yīng)具有相同的結(jié)構(gòu)單元但是不同的寡核苷酸標(biāo)簽來實(shí)現(xiàn)。或者,多重標(biāo)記可以通過在一個標(biāo)記反應(yīng)中混合適當(dāng)比例的每種標(biāo)簽和各個結(jié)構(gòu)單元來實(shí)現(xiàn)。在一個實(shí)施方案中,起始寡核苷酸是雙鏈,且兩條鏈共價連接。共價連接兩條鏈的一種手段如圖3所示,其中利用連接部分例如連接體連接兩條鏈和功能部分。該連接部分可以是任何化學(xué)結(jié)構(gòu),其包含適合與結(jié)構(gòu)單元反應(yīng)的第一官能團(tuán),適合與寡核苷酸的3,-末端反應(yīng)的第二官能團(tuán),和適合與寡核苷酸的5,-末端反應(yīng)的第三官能團(tuán)。優(yōu)選地,第二和第三官能團(tuán)的定向使兩條寡核苷酸鏈為相對的方向,這可使兩條鏈雜交。例如,連接部分例如連接體可以具有通式結(jié)構(gòu)(I):b(i)其中A是能夠與結(jié)構(gòu)單元形成共價鍵的官能團(tuán),B是能夠與寡核苷酸的5,-末端形成鍵的官能團(tuán),C是能夠與寡核苷酸的3,-末端形成鍵的官能團(tuán)。D、F和E是將官能團(tuán)A、C和B與S連接的化學(xué)基團(tuán),S為核心原子或支架。優(yōu)選地,D、E和F各自獨(dú)立地為原子鏈,如亞烷基鏈或低聚(乙二醇)鏈,D、E和F可以相同或不同,并且優(yōu)選地有效地4吏兩個寡核苷酸雜交及功能部分合成。在一個實(shí)施方案中,三價連接部分是具有以下結(jié)構(gòu)的連接體<formula>formulaseeoriginaldocumentpage42</formula>在該實(shí)施方案中,NH基可用于連接結(jié)構(gòu)單元,而末端磷酸基可用于連接寡核苷酸。在起始寡核苷酸是雙鏈的實(shí)施方案中,引入寡核苷酸也是雙鏈。如圖3所示,起始寡核苷酸的一條鏈可以比另一條長,提供突出端序列。在該實(shí)施方案中,引入寡核苷酸包括與起始寡核苷酸的突出端序列互補(bǔ)的突出端序列。兩個互補(bǔ)突出端序列的雜交使引入寡核苷酸進(jìn)入與起始寡核苷酸連接的位置。這種連接可以用DNA或RNA連接酶酶促進(jìn)行。引入寡核苷酸和起始寡核苷酸的突出端序列優(yōu)選地長度相同,并且由兩個或多個核苷酸、優(yōu)選地2個至約IO個核苷酸、更優(yōu)選2個至約6個核苷酸組成。在一個優(yōu)選的實(shí)施方案中,引入寡核苷酸是在每一末端都有一個突出端序列的雙鏈寡核苷酸。在一個末端處的突出端序列與起始寡核苷酸的突出端序列互補(bǔ),而在引入寡核苷酸與起始寡核苷酸連接后,在另一末端處的突出端序列成為下一循環(huán)的起始寡核苷酸的突出端序列。在一個實(shí)施方案中,三個突出端序列長度均為2至6個核苷酸,引入寡核香酸的編碼序列長度為3至10個核苷酸,優(yōu)選3至6個核苷酸。在一個特定實(shí)施方案中,突出端序列的長度均為2個核苷酸,編碼序列的長度為5個核苷酸。在圖4所示的實(shí)施方案中,引入鏈在其3,末端具有與起始寡核苷酸的3,末端互補(bǔ)的區(qū)域,在兩條鏈的5'末端留有突出端。5'末端可以利用(如)DNA聚合酶如vent聚合酶補(bǔ)平,產(chǎn)生雙鏈的延長寡核苷酸??梢猿ピ摴押塑账岬牡祖?,并利用相同的方法向頂鏈的3'末端添加另外<formula>formulaseeoriginaldocumentpage42</formula>的序列。連續(xù)添加標(biāo)識每個連續(xù)結(jié)構(gòu)單元的寡核苷酸導(dǎo)致形成編碼寡核苷酸標(biāo)簽。在本發(fā)明方法的一個實(shí)施方案中,連續(xù)寡核苷酸標(biāo)簽可以通過酶連接偶聯(lián),產(chǎn)生編碼寡核苷酸。酶催化的寡核苷酸連接可以用具有連接核酸片段能力的任何酶進(jìn)行。酶的例子包括連接酶、聚合酶和拓樸異構(gòu)酶。在本發(fā)明的特定實(shí)施方案中,應(yīng)用DNA連接酶(EC6.5.1.1)、DNA聚合酶(EC2.7.7.7)、RNA聚合酶(EC2.7.7.6)或拓樸異構(gòu)酶(EC5.99.1.2)連接寡核普酸。每個EC類別中所含的酶可見于如Bairoch(2000)NucleicAcidsResearch28:304-5所述。在一個優(yōu)選實(shí)施方案中,在本發(fā)明方法中使用的寡核苷酸是寡脫氧核苷酸,用來催化寡核苷酸連接的酶是DNA連接酶。為了在連接酶存在下發(fā)生連接,即為了在兩個寡核苷酸之間形成磷酸二酯鍵,一個寡核苷酸必須具有游離的5'磷酸基,而另一個寡核苷酸必須具有游離的3,羥基。可以在本發(fā)明的方法中使用的DNA連接酶的例子包括T4DNA連接酶、TaqDNA連接酶、T4RNA連接酶、DNA連接酶(大腸桿菌)(均獲自如NewEnglandBiolabs,MA)。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,用于連接的各種酶在特定條件如溫度、緩沖液濃度、pH和時間下具有最佳活性。這些條件中的每一個都可以調(diào)節(jié),例如根據(jù)制造商說明進(jìn)行調(diào)節(jié),以獲得寡核苷酸標(biāo)簽的最佳連接。引入寡核苷酸可以是任何需要的長度,但優(yōu)選長度為至少三個核堿基。更優(yōu)選地,引入寡核苷酸的長度為4個或更多的核堿基。在一個實(shí)施方案中,引入寡核苷酸的長度為3至約12個核堿基。本發(fā)明文庫中的分子的寡核苷酸優(yōu)選具有共同的末端序列,如本領(lǐng)域所知,該序列可以用作PCR的引物。這種共同末端序列可以在文庫合成的最后一個循環(huán)中引入作為引入寡核苷酸的末端,或者可以在文庫合成后添加,例如利用本文7>開的酶連接方法添加。本發(fā)明方法的一個優(yōu)選實(shí)施方案如圖5所示。該過程開始于在5,末端與連接體連接的合成DNA序列,該連接體終止于氨基。在步驟1中,在Tris緩沖液中在夾板DNA鏈、DNA連接酶和二硫蘇糖醇的存在下,該起始DNA序列與引入DNA序列連接。產(chǎn)生標(biāo)記DNA序列,該序列然后可以直接用于下一步驟中,或者在進(jìn)行下一步驟之前例如利用HPLC或乙醇沉淀純化。在步驟2中,標(biāo)記DNA與被保護(hù)的活化氨基酸反應(yīng),在該實(shí)施例中,與Fmoc-保護(hù)的氨基酸氟化物反應(yīng),產(chǎn)生被保護(hù)的氨基酸-DNA偶聯(lián)物。在步驟3中,例如在哌啶的存在下將被保護(hù)的氨基酸-DNA偶聯(lián)物脫保護(hù),任選地例如通過HPLC或乙醇沉淀純化產(chǎn)生的脫保護(hù)的偶聯(lián)物。脫保護(hù)的偶聯(lián)物是第一合成循環(huán)的產(chǎn)物,并且成為第二循環(huán)的起始材料,第二循環(huán)向脫保護(hù)偶聯(lián)物的游離氨基上添加第二氨基酸殘基。在利用PCR擴(kuò)增和/或測序所選分子的編碼寡核苷酸的實(shí)施方案中,該編碼寡核苷酸可以包括例如PCR引物序列和/或測序引物(例如引物,例如3,-GACTACCGCGCTCCCTCCG-5,和3,-GACTCGCCCGACCGTTCCG-5,)。例如,在合成的第一循環(huán)之前,PCR引物序列可以包含在起始寡核苷酸中,和/或可以與第一引入寡核苷酸一起包含,和/或可以在文庫合成的最后一個循環(huán)后與編碼寡核苷酸連接,和/或可以包含在最后一個循環(huán)的引入寡核苷酸中。在文庫合成最后一個循環(huán)后和/或在引入寡核苷酸中添加的PCR引物序列在本文中稱為"加帽序列"。在一個實(shí)施方案中,PCR引物序列設(shè)計為編碼寡核苷酸標(biāo)簽。例如,PCR引物序列可以引入起始寡核苷酸標(biāo)簽中,和/或可以引入最終寡核苷酸標(biāo)簽中。在一個實(shí)施方案中,將相同的PCR引物序列引入起始和最終寡核苷酸標(biāo)簽中。在另一個實(shí)施方案中,將第一PCR引物序列引入起始寡核苷酸標(biāo)簽中,將第二PCR引物序列引入最終寡核苷酸標(biāo)簽中?;蛘?,第二PCR引物序列可以引入如本文所述的加帽序列中。在優(yōu)選實(shí)施方案中,PCR引物序列的長度至少約為5、7、10、13、15、17、20、22或25個核苷酸。適合在本發(fā)明的文庫中使用的PCR引物序列在本領(lǐng)域中公知;合適的引物和方法例如描述在Innis等人,編,尸O/Votoco/r^toSanDiego:WO2004/069849和WO2005/003375所述的引物,其完整內(nèi)容引入本文作為參考。如本文所用的術(shù)語"多核苷酸"用于引物、探針和將要通過引物延伸合成的核酸片段或區(qū)段時,定義為由兩個或多個、優(yōu)選三個以上脫氧核糖核苷酸組成的分子。如本文所用的術(shù)語"引物"是指從核酸限制性消化物中純化的或合成產(chǎn)生的多核苷酸,當(dāng)置于誘導(dǎo)合成與核酸鏈互補(bǔ)的引物延伸產(chǎn)物的條件下時,即在核苷酸和聚合試劑如DNA聚合酶、逆轉(zhuǎn)錄酶等的存在下,以及在合適的溫度和pH下,它能夠作為核酸合成的起點(diǎn)。為了效率最高,引物優(yōu)選是單鏈,但是也可以是雙鏈形式。如果是雙鏈,則在用來制備延伸產(chǎn)物之前首先處理該引物,使它與互補(bǔ)鏈分開。優(yōu)選地,引物是一種聚脫氧核糖核苷酸。引物必須足夠長,以在聚合試劑存在下引發(fā)延伸產(chǎn)物的合成。引物的確切長度取決于許多因素,包括溫度和引物來源。本文所用的引物選擇為與所要擴(kuò)增的每個特定序列的不同鏈"基本,,互補(bǔ)。意思是引物必須充分互補(bǔ),以便與相應(yīng)的模板鏈非隨機(jī)地雜交。因此,引物序列可能反映或者可能不反映模板的準(zhǔn)確序列。多核苷酸引物可以用任何合適的方法制備,例如Narang等人,(1979)五"2^mo/.,68:90;美國專利號4,356,270,美國專利號4,458,066,美國專利號4,416,988,美國專利號4,293,652;和Brown等人,(1979)Me仇五"z;wo/.,68:109所述的磷酸三酯或磷酸二酯法。上述所有文獻(xiàn)的內(nèi)容在此引用作為參考。在引入寡核苷酸包含PCR引物序列的情況中,這些引入寡核苷酸優(yōu)選地明顯長于在其他循環(huán)中添加的引入寡核苷酸,因?yàn)樗鼈兗劝幋a序列也包含PCR引物序列。在一個實(shí)施方案中,在添加最后的結(jié)構(gòu)單元和最后的引入寡核苷酸后添加加帽序列,如本文所述的文庫的合成包括將加帽序列與編碼寡核普酸連接的步驟,使得基本所有文庫成員的寡核苷酸部分終止于包含PCR引物序列的序列中。優(yōu)選地,通過與作為最后合成循環(huán)的產(chǎn)物的組合組分連接,添加該加帽序列。加帽序列可以用文庫構(gòu)建中使用的酶法添加。在一個實(shí)施方案中,相同的加帽序列連接到文庫的每個成員上。在另一實(shí)施方案中,使用多個加帽序列。在該實(shí)施方案中,含有可變堿基的寡核苷酸加帽序列例如在最后的合成循環(huán)后連接到文庫成員上。在一個實(shí)施方案中,在最后的合成循環(huán)后,合并部分,然后再次分成部分,每一部分添加不同的加帽序列?;蛘?,可以在最后的合成循環(huán)后向合并的文庫中添加多種加帽序列。在這兩個實(shí)施方案中,最終的文庫成員包括含有連接到標(biāo)識寡核苷酸(包括兩種或多種不同的加帽序列)上的特定功能部分的分子。在一個實(shí)施方案中,加帽引物包含含有可變(即簡并)核苷酸的寡核苷酸序列。加帽引物內(nèi)的這些簡并堿基允許通過確定結(jié)構(gòu)單元組合是PCR復(fù)制的結(jié)果(相同序列)還是獨(dú)立出現(xiàn)的分子(不同序列)來標(biāo)識目標(biāo)文庫分子。例如,這些簡并石咸基可以減少在生物學(xué)篩查編碼文庫過程中鑒定的潛在的假陽性數(shù)。在一個實(shí)施方案中,簡并加帽引物包含或者具有以下序列5,-CAGCGTTCGA-3,3,-AAGTCGCAAGCTNNNNNGTCTGTTCGAAGTGGACG-5,用于連接用于引物到文庫上延伸的恒的重疊定區(qū)簡并序列用于擴(kuò)增的恒定區(qū)其中N可以是4種堿基中的任意一種,允許1024種不同的序列(45)。在連接到文庫和引物延伸后,引物具有以下序列5'-CAGCGTTCGAN,N,N,N,N,CAGACAAGCTTCACCTGC-3,3,-AAGTCGCAAGCTNNNNNGTCTGTTCGAAGTGGACG匿5'在另一實(shí)施方案中,加帽引物包含或者具有以下序列3,-AAGTCGCAAGCTACGABBBABBBABBBAGACTACCGCGCTCCCTCCGA皋皋用于連接用于引物到文庫上延伸的恒的重疊定區(qū)用于擴(kuò)增的恒定區(qū)其中B可以是C、G或T中的任一種,允許19683種不同序列(39)。該引物中的簡并區(qū)的設(shè)計改善了DNA序列分析,因?yàn)樵诤啿堿基側(cè)翼并打斷B堿基的A堿基阻止超過3個堿基的均聚延伸,并且有利于序列比對。在一個實(shí)施方案中,使用合適的酶將簡并加帽寡核苷酸連接到文庫成員上,隨后使用合適的酶如DNA聚合酶聚合簡并加帽寡核苷酸的上鏈。在另一個實(shí)施方案中,PCR引物序列是"通用銜接子"或"通用引物"。本文使用的"通用銜接子"或"通用引物"是含有獨(dú)特PCR引發(fā)區(qū)的寡核苷酸,例如,其長度大約為5、7、10、13、15、17、20、22或25個核普酸,并且位于獨(dú)特測序引發(fā)區(qū)的附近,例如,該測序引發(fā)區(qū)的長度大約為5、7、10、13、15、17、20、22或25個核苷酸,任選地隨后是由4種脫氧核糖核苷酸(即A、C、G、T)中的至少一種組成的獨(dú)特識別關(guān)鍵序列(或樣品標(biāo)識序列)。本文使用的術(shù)語"識別關(guān)鍵序列"或"樣品標(biāo)識序列"是指可以用來從樣品中獨(dú)特標(biāo)記分子群體的序列。多種樣品(每種含有獨(dú)特的樣品標(biāo)識序列)可以混合,測序,并在DNA測序后重新分選,用于分析單獨(dú)的樣品。對整個文庫可以使用相同的識別序列,或者,可以利用不同的識別關(guān)鍵序列追蹤不同的文庫。在一個實(shí)施方案中,識別關(guān)鍵序列在5'PCR引物上、3,PCR引物上或這兩種引物上。如果兩種PCR引物都含有樣品標(biāo)識序列,則可以用獨(dú)特樣品標(biāo)識序列合并的不同樣品數(shù)是每種引物上樣品標(biāo)識序列數(shù)的積。因此,IO種不同的5'樣品標(biāo)識序列引物可以與IO種不同的3,樣品標(biāo)識序列引物組合,產(chǎn)生100種不同的樣品標(biāo)識序列組合。含有識別關(guān)鍵序列的5,和3'獨(dú)特PCR引物的非限制性實(shí)例包括以下5'引物(可變位點(diǎn)用粗體和斜體標(biāo)出)5'A-GCCTTGCCAGCCCGCTCAG4TGACTCCCAAATCGATGTGj5'C-GCCTTGCCAGCCCGCTCAGCTGACTCCCAAATCGATGTG;5'G_GCCTTGCCAGCCCGC丁CAGGTGACTCCCAAATCGATGTGj5'T-GCCTTGCCAGCCCGCTCAG7TGACTCCCAAATCGATGTG;5'AA_GCCTTGCCAGCCCGCTCAGA4TGACTCCCAAATCGATGTG;5'AC_GCCTTGCCAGCCCGCTCA04CTGACTCCCAAATCGATGTG;5'AG-GCCTTGCCAGCCCGCTCAG/4GTGACTCCCAAATCGATGTG;5'CA-GCCTTGCCAGCCCGCTCAGC4TGACTCCCAAATCGATGTG。3,SID引物(可變位點(diǎn)用粗體和斜體,標(biāo)出)3'A-GCCTCCCTCGCGCCATCA04GCAGGTGAAGCTTGTCTG;3,C-GCCTCCCTCGCGCCATCAGCGCAGGTGAAGCTTGTCTG;3'G-GCCTCCCTCGCGCCATCAGC7GCAGGTGAAGCTTGTCTG;3'T-GCCTCCCTCGCGCCATCAGrGCAGGTGAAGCTTGTCTG;3'AA-GCCTCCCTCGCGCCATCAGA4GCAGGTGAAGCTTGTCTG;3'AC-GCCTCCCTCGCGCCATCAGJCGCAGGTGAAGCTTGTCTG;3'AG-GCCTCCCTCGCGCCATCAG/4GGCAGGTGAAGCTTGTCTG;3'AT-GCCTCCCTCGCGCCATCA04:TGCAGGTGAAGCTTGTCTG;和3'CA-GCCTCCCTCGCGCCATCAGC4GCAGGTGAAGCTTGTCTG在一個實(shí)施方案中,識別關(guān)鍵序列的長度為大約4、5、6、7、8、9或10個核苷酸。在另一個實(shí)施方案中,識別關(guān)鍵序列是大約1-4個核苷酸的組合。在另一個實(shí)施方案中,每個通用銜接子的長度大約為44個核苷酸。在一個實(shí)施方案中,使用T4DNA連接酶將通用銜接子連接到編碼寡核苷酸的末端上。可以為每個文庫制品具體設(shè)計不同的通用銜接子,因此為每個文庫提供獨(dú)特的標(biāo)識。本領(lǐng)域技術(shù)人員在認(rèn)為必要時可以改變通用銜接子的大小和序列。如上所述,作為本發(fā)明方法一部分的寡核苷酸標(biāo)簽的核苷酸序列可以用聚合酶鏈反應(yīng)(PCR)確定。寡核苷酸標(biāo)簽由標(biāo)識構(gòu)成如本文所述功能部分的結(jié)構(gòu)單元的多核苷酸組成。寡核苷酸標(biāo)簽的核酸序列通過如下所述對寡核苷酸標(biāo)簽進(jìn)行PCR反應(yīng)來測定。適當(dāng)樣品與PCR引物對接觸,該引物對的每個成員具有預(yù)先選擇的核苷酸序列。該P(yáng)CR引物對通過與編碼寡核苷酸標(biāo)簽上的PCR引物結(jié)合部位雜交,能夠啟動引物延伸反應(yīng)。該P(yáng)CR引物結(jié)合部位優(yōu)選地設(shè)計在編碼寡核苷酸標(biāo)簽內(nèi)部。例如,PCR引物結(jié)合部位可以摻入起始寡核苷酸標(biāo)簽內(nèi),而第二PCR引物結(jié)合部位可以位于最終寡核苷酸標(biāo)簽內(nèi)。或者,第二PCR引物結(jié)合部位可以摻入如本文所述的加帽序列中。在優(yōu)選實(shí)施方案中,該P(yáng)CR引物結(jié)合部位的長度至少為約5、7、10、13、15、17、20、22或25個核苷酸。通過將PCR引物對(優(yōu)選預(yù)定量的該引物對)與編碼寡核苷酸標(biāo)簽的核酸(優(yōu)選預(yù)定量的該核酸)在PCR緩沖液中混合形成PCR反應(yīng)混合物,進(jìn)行PCR反應(yīng)。將該混合物熱循環(huán)一定的循環(huán)數(shù),該循環(huán)數(shù)一般預(yù)先確定,足以形成PCR反應(yīng)產(chǎn)物。足夠量的產(chǎn)物是能夠以足以進(jìn)行DNA序列測定的量分離的產(chǎn)物。PCR—般通過熱循環(huán)進(jìn)行,即在一個溫度范圍內(nèi)重復(fù)地提高和降低PCR反應(yīng)混合物的溫度,該范圍的下限為約30。C至約55。C,上限為約90。C至約100。C。提高和降低可以是連續(xù)的,但優(yōu)選是階段的,在有利于多核苷酸合成、變性和雜交的各個溫度下保持相對溫度穩(wěn)定的時間段。PCR反應(yīng)用任何適當(dāng)?shù)姆椒ㄟM(jìn)行。通常在緩沖的水溶液即PCR緩沖液中進(jìn)行,優(yōu)選為pH7-9。優(yōu)選含有摩爾過量的引物。為了提高該方法的效率,優(yōu)選較大的摩爾過量。PCR緩沖液還含有脫氧核糖核苷酸三磷酸(多核苷酸合成底物)dATP、dCTP、dGTP和dTTP,和聚合酶,一般是熱穩(wěn)定的聚合酶,都是足以進(jìn)行引物延伸(多核苷酸合成)反應(yīng)的量。得到的溶液(PCR混合物)加熱至約90。C-100。C約1-10分鐘,優(yōu)選1-4分鐘。該加熱階段之后將溶液冷卻至54°C,該溫度是引物雜交優(yōu)選的。合成反應(yīng)可以在一定溫度下發(fā)生,該溫度的范圍從室溫到高于該溫度聚合酶(誘導(dǎo)劑)即不再有效作用的溫度。因此,例如,如果使用DNA聚合酶,則溫度通常不高于約40。C。重復(fù)該熱循環(huán),直到產(chǎn)生所需量的PCR產(chǎn)物。一種典型的PCR緩沖液每100微升緩沖液含有下列試劑50mMKC1;10mMTris畫HClpH8.3;1.5mMMgCl2;0.001%(wt/vol)明膠,200dATP;200pMdTTP;200|uMdCTP;200|iMdGTP;和2.5單位棲熱水生菌(Thermusaquaticus)(Taq)DNA聚合酶I。用于延伸引物序列的合適的酶包括例如大腸桿菌DNA聚合酶I、TaqDNA聚合酶、大腸桿菌DNA聚合酶I的Klenow片段、T4DNA聚合酶、其他可以使用的DNA聚合酶、逆轉(zhuǎn)錄酶,和其他酶,包括熱穩(wěn)定的酶,其有利于以適當(dāng)?shù)姆绞浇M合核苷酸,形成與每條核酸鏈互補(bǔ)的引物延伸產(chǎn)物。合成通常開始于每個引物的3'末端,并沿著模板鏈以5'方向前進(jìn),直到合成終止,產(chǎn)生不同長度的分子。新合成的DNA鏈與其互補(bǔ)鏈形成雙鏈分子,該雙鏈分子可以在分析方法的后續(xù)步驟中使用。PCR擴(kuò)增方法在美國專利號4,683,192、4,683,202、4,800,159和4,965,188中詳細(xì)描述,并且至少在PCRTechnology:PrinciplesandApplicationsforDNAAmplification,H.Erlich,ed.,StocktonPress,NewYork(1989);和PCRProtocols:AGuidetoMethodsandApplications,Innis等人,編,AcademicPress,SanDiego,Calif.(1990)中詳細(xì)描述。上述所有文獻(xiàn)的內(nèi)容在此引用作為參考。一旦擴(kuò)增出編碼寡核苷酸標(biāo)簽,即可應(yīng)用核酸序列分析確定該標(biāo)簽的序列,并最終確定選擇的分子的組成,核酸序列分析是用于測定核苷酸序列的眾所周知的方法。核酸序列分析通過以下方法的組合進(jìn)行(a)基于探針鏈與其互補(bǔ)靶標(biāo)雜交或變性的理化技術(shù),和(b)與聚合酶的酶反應(yīng)。本發(fā)明進(jìn)一步涉及可以用本發(fā)明的方法制備的化合物,和這樣的化合物的集合,它們作為分離的物質(zhì)或組合形成化學(xué)結(jié)構(gòu)文庫。本發(fā)明的化合物包括下式的化合物其中X是包含一個或多個結(jié)構(gòu)單元的功能部分,Z是在其3'末端與B連接的寡核苷酸,Y是在其5'末端與C連接的寡核苷酸。A是與X形成共價鍵的官能團(tuán),B是與Z的3'-末端形成鍵的官能團(tuán),C是與Y的5,-末端形成鍵的官能團(tuán)。D、F和E是將官能團(tuán)A、C和B與S連接的化學(xué)基團(tuán),S是核心原子或支架。優(yōu)選地,D、E和F各自獨(dú)立地是原子鏈,如亞烷基鏈或低聚(乙二醇)鏈,D、E和F可以相同或不同,優(yōu)選地有效地使兩個寡核苷酸雜交以及功能部分合成。優(yōu)選地,Y和Z基本互補(bǔ),并且在化合物中定向,從而能夠在合適條件下發(fā)生Watson-Crick石威基配對和雙《連體形成。Y和Z的長度相同或不同。優(yōu)選地,Y和Z的長度相同,或者Y和Z之一比另一個長1至IO個堿基。在一個優(yōu)選實(shí)施方案中,Y和Z各自為IO個或更多堿基的長度,并且具有10個或更多個堿基對的互補(bǔ)區(qū)。更優(yōu)選地,Y和Z在其全長上基本互補(bǔ),即它們每十個堿基對的錯配不超過1個。最優(yōu)選地,Y和Z在其全長上互補(bǔ),即,除了Y或Z上的任何突出端區(qū)域之外,這些鏈通過Watson-Crick堿基配對雜交,在它們的全長上沒有錯配。S可以是單一原子或分子支架。例如,S可以是碳原子、硼原子、氮原子或磷原子,或多原子支架,如磷酸基或環(huán)基,如環(huán)烷基、環(huán)烯基、雜環(huán)烷基、雜環(huán)烯基、芳基或雜芳基。在一個實(shí)施方案中,連接體是如下結(jié)構(gòu)的基團(tuán)-(CH2)n-OP(O)20——(CH2CH20)m——OPO3--0P(0)2O——(CH2CH20)p——OP03-其中n、m和p各自獨(dú)立地是l至約20的整數(shù),優(yōu)選2至8,更優(yōu)選3至6。在一個特定實(shí)施方案中,連接體具有以下所示的結(jié)構(gòu)。在一個實(shí)施方案中,本發(fā)明的文庫包括由功能部分組成的分子,該功能部分由結(jié)構(gòu)單元組成,其中每個功能部分都與編碼寡核苷酸有效連接。編碼寡核苷酸的核苷酸序列指示功能部分中存在的結(jié)構(gòu)單元,在一些實(shí)施方案中,指示結(jié)構(gòu)單元的連接性或排列。本發(fā)明具有以下優(yōu)點(diǎn),用來構(gòu)建功能部分及用來構(gòu)建寡核苷酸標(biāo)簽的方法可以在相同的反應(yīng)介質(zhì)中、優(yōu)選地在水性介質(zhì)中進(jìn)行,從而與現(xiàn)有技術(shù)的方法相比簡化了制備文庫的方法。在寡核苷酸連接步驟和結(jié)構(gòu)單元添加步驟都可以在水性介質(zhì)中進(jìn)行的某些實(shí)施方案中,每個反應(yīng)都具有不同的最適pH。在這些實(shí)施方案中,結(jié)構(gòu)單元添加反應(yīng)可以在合適的含水緩沖液中在合適的pH和溫度下進(jìn)行。然后緩沖液可以用提供適于寡核苷酸連接之pH的含水緩沖液替換。在另一個實(shí)施方案中,本發(fā)明提供式II的化合物和含有這些化合物的文庫Z——L^At—X(Y)n(n)其中X是分子支架,每個Y獨(dú)立地是周圍部分,n是l-6的整數(shù)。每個A獨(dú)立地是結(jié)構(gòu)單元,n是0至約5的整數(shù)。L是連接部分,Z是標(biāo)識結(jié)構(gòu)-At-X(Y)n的單鏈或雙鏈寡核苷酸。結(jié)構(gòu)X(Y)n可以是例如表8所示的一種支架結(jié)構(gòu)(見下文)。在一個實(shí)施方案中,本發(fā)明提供式m的化合物和含有這些化合物的文庫其中t是0至大約5的整數(shù),優(yōu)選0-3的整數(shù),A獨(dú)立地是結(jié)構(gòu)單元。L是連接部分,Z是標(biāo)識每個A和R,、R2、R3和R4的單鏈或雙鏈寡核香酸。R!、R2、R3和R4各自獨(dú)立地是取代基。選自氫、烷基、取代的烷基、雜烷基、if又代的雜烷基、環(huán)烷基、雜環(huán)烷基、取代的環(huán)烷基、取代的雜環(huán)烷基、芳基、取代的芳基、芳烷基、雜芳烷基、取代的芳垸基、取代的雜芳烷基、雜芳基、取代的雜芳基、烷氧基、芳氧基、氨基和取代的氨基。在一個實(shí)施方案中,每個A是氨基酸殘基。包含式II或式III的化合物的文庫可以包含至少約100、1000、10,000、IOO,OOO、1,000,000或IO,OOO,OOO種式II或式III的化合物。在一個實(shí)施方案中,通過^殳計用于產(chǎn)生至少含有約100、1000、IO,OOO、ioo,ooo、i,ooo,ooo或io,ooo,ooo種式n或式in的化合物的文庫的方法制備文庫。醛/酮其他參考文獻(xiàn)<formula>formulaseeoriginaldocumentpage54</formula>■R1Carranco,I.等人.(2005)J.Comb.Chem.7:33-41O胺苯甲醛和糠醛Rosamilia,A.E.等人.(2005)OrganicLetters7:1525-1528NH2CHO、R1R3SyedaH眼a,H'Z.等人.(2002)TetLett43:6485-6488NHBocTempest,P.等人.(2001)TetLett42:4959-4962200680027615.7勢溫1被39/99^;<formula>formulaseeoriginaldocumentpage55</formula>Bose,A.K.等人.(2005)TetLett46:1901-1903Stadler,A.andKappe'C.O.(2001)J.Comb.Chem.3:624-630;Lengar,A.andKappe,C.O.(2004)OrganicLetters6:771-774Ivachtchenko,A.V.等人.(2003).Comb.Chem.5:775-788Micheli,F.等人.(2001)J.Comb.Chem.3:224-228200680027615.7勢溢1被41/99:a;R1—HSR1—NH2Stemson,S.M.等人.(2001)Org.Lett.3:4239-4242Cheng,W,C.等人.(2002)J.Org.Chem.67:5673-5677;Park,K.-H.等人.(2001)JCombChem3:171-176O■coavteBrown,B丄等人.(2000)Synlett1:131-133R1—NH2Kilburn,J.P.等人.(2001)TetLett42:2583-2586<formula>formulaseeoriginaldocumentpage58</formula><formula>formulaseeoriginaldocumentpage58</formula><formula>formulaseeoriginaldocumentpage58</formula>R1—NH2Makara,G.M.等人.(2002)OrganicLett4:1751-1754Schell,P.等人.(2005)J.Comb.Chem7:96-98NH2Feliu,L.等人.(2003)J.Comb.Chem.5:356-361200680027615.7勢溢1被44/99:a;Hiroshige,M.等人.(1995)J.Am.Chem.Soc.117:11590-11591Bose,A.K.等人.氛基酸(2005)TetLett46:1901-1903200680027615.7勢溢1被45/99:a;本發(fā)明的方法的一個優(yōu)點(diǎn)是它們能夠用來制備含有大量化合物的文庫。利用公知方法如聚合酶鏈反應(yīng)("PCR")擴(kuò)增編碼寡核苷酸序列的能力意味著,即使回收的拷貝較少,也能夠鑒定選擇的分子。這允許實(shí)際應(yīng)用極大的文庫,其由于高度復(fù)雜性,要么包含相對較少拷貝的任何特定文庫成員,要么需要使用極大的體積。例如,由108個獨(dú)特結(jié)構(gòu)組成的文庫(其中每個結(jié)構(gòu)具有1x1012個拷貝(約1皮摩爾))需要約100L的1laM有效濃度的溶液。對于相同的文庫,如果每個成員有l(wèi),OOO,OOO個拷貝,則在1iaM有效濃度下需要的體積為100pL。在一個優(yōu)選實(shí)施方案中,文庫包含約103至約1015個拷貝的每個文庫成員。假定文庫成員之間的合成效率有差異,則不同文庫成員在任何特定文庫中可能具有不同的拷貝數(shù)。因此,盡管文庫中理論存在的每個成員的拷貝數(shù)可能相同,但是任何特定文庫成員的實(shí)際拷貝數(shù)與任何其他成員的拷貝數(shù)無關(guān)。更優(yōu)選地,本發(fā)明的化合物文庫包括至少約105、106或107個拷貝的每個文庫成員,或基本上所有文庫成員。"基本上所有"文庫成員含意是至少約85%的文庫成員,優(yōu)選至少約90%,更優(yōu)選至少約95%的文庫成員。優(yōu)選地,文庫包含足夠拷貝數(shù)的每個成員,可對生物靶標(biāo)進(jìn)行多輪(即兩輪或兩輪以上)選擇,在最后一輪選擇后剩余足夠數(shù)量的結(jié)合分子,使剩余的分子的寡核苷酸標(biāo)簽?zāi)軌驍U(kuò)增,因此能夠標(biāo)識結(jié)合分子的功能部分。這種選擇方法的示意圖在圖6中顯示,其中1和2代表文庫成員,B是靶分子,X是與B有效連接的部分,使得能夠從選擇介質(zhì)中除去B。在該實(shí)例中,化合物1與B結(jié)合,而化合物2不與B結(jié)合。如第1輪所示,該選擇過程包括(I)在適合化合物1與B結(jié)合的條件下使包含化合物1和2的文庫接觸B-X;(II)除去未結(jié)合的化合物2,(III)從B上解離化合物1,并從反應(yīng)介質(zhì)中除去BX。第1輪的結(jié)果是相對于化合物2富含化合物1的分子集合。后續(xù)使用步驟I-III的幾輪導(dǎo)致化合物l相對于化合物2的進(jìn)一步富集。盡管圖6顯示了3輪選擇,但是實(shí)際上可以使用任何輪數(shù),例如1至10輪,以實(shí)現(xiàn)所需的結(jié)合分子相對于非結(jié)合分子的富集。在圖6所示的實(shí)施方案中,在任何選擇輪數(shù)之后剩余的化合物沒有擴(kuò)增(更多拷貝的合成)。這樣的擴(kuò)增可以產(chǎn)生與選擇后剩余的化合物的相對量不一致的化合物的混合物。這種不一致是由于這一事實(shí),即某些化合物可能比其他化合物更容易合成,因此可能在選擇后以與其存在不成比例的方式擴(kuò)增。例如,如果化合物2比化合物1更容易合成,則第2輪后剩余的分子的擴(kuò)增將導(dǎo)致化合物2相對于化合物1的不成比例擴(kuò)增,獲得的化合物的混合物具有更低的(如果有的話)化合物1相對于化合物2的富集。在一個實(shí)施方案中,利用任何公知的固定技術(shù)將靶標(biāo)固定在固體支持體上。該固體支持體可以是,例如層析柱或膜中所含的水不溶性基質(zhì)。編碼文庫可以加到層析柱中所含的水不溶性基質(zhì)上。然后洗柱,除去非特異性結(jié)合物。然后通過改變pH、鹽濃度、有機(jī)溶劑濃度或其他方法,如與已知配體竟?fàn)幇覙?biāo),使與靶標(biāo)結(jié)合的化合物解離。在另外一個實(shí)施方案中,靶標(biāo)在溶液中游離,并與編碼文庫溫育。通過大小分離步驟,如凝膠過濾或超濾,選擇性分離與靶標(biāo)(在此也稱作"配體")結(jié)合的化合物。在一個實(shí)施方案中,編碼化合物與靶生物分子的混合物通過大小排阻層析柱(凝膠過濾),從未結(jié)合的化合物中分離任何配體-耙標(biāo)復(fù)合物。將該配體-耙標(biāo)復(fù)合物轉(zhuǎn)移到反相層析柱上,將配體與耙標(biāo)解離。解離的配體然后通過PCR擴(kuò)增和編碼寡核苷酸的序列分析進(jìn)行分析。在靶標(biāo)的固定可導(dǎo)致活性喪失的情況下,該方法特別有利。在本發(fā)明的一些實(shí)施方案中,選擇方法可以包括在測序之前擴(kuò)增可與把標(biāo)結(jié)合的化合物文庫的至少一個成員的編碼寡核苷酸。在一個實(shí)施方案中,包含編碼寡核苷酸的化合物文庫在序列分析之前擴(kuò)增,以使選擇的文庫混合物中存在的DNA分子群體分布中的任何潛在不對稱(skew)最小化。例如,在選擇步驟后只回收少量文庫,一般在序列分析之前利用PCR擴(kuò)增。PCR具有產(chǎn)生在選擇的文庫混合物中存在的DNA分子群體分布不對稱的潛力。當(dāng)輸入分子數(shù)較少而輸入分子是較差的PCR模板時這尤其是一個問題。早期循環(huán)產(chǎn)生的PCR產(chǎn)物是比共價雙鏈體文庫更有效的模板,因此這些分子在最終擴(kuò)增的群體中的頻率可能遠(yuǎn)高于在原始輸入模板中的頻率。因此,為了使這種潛在的PCR不對稱最小化,在本發(fā)明的一個實(shí)施方案中,例如在一個反應(yīng)中利用一種引物產(chǎn)生對應(yīng)于各個文庫成員的單鏈寡核苷酸群體,然后使用兩種引物進(jìn)行PCR擴(kuò)增。這樣,在使用PCR進(jìn)行指數(shù)擴(kuò)增之前,單鏈引物延伸產(chǎn)物線性積累,積累的引物延伸產(chǎn)物中的分子的多樣性和分布更精確地反映了原始輸入模板中存在的分子的多樣性和分布,因?yàn)橹笖?shù)擴(kuò)增階段只在31物延伸反應(yīng)過程中產(chǎn)生的分子群體中代表存在的多數(shù)原始分子多樣性之后才發(fā)生。一旦通過上述方法鑒定了單一配體,即可以應(yīng)用各種水平的分析獲得結(jié)構(gòu)-活性關(guān)系的信息,并指導(dǎo)配體的親和力、特異性和生物活性的進(jìn)一步優(yōu)化。對于來源于同一支架的配體,可以利用三維分子模建鑒定這些配體共同的顯著結(jié)構(gòu)特征,從而產(chǎn)生可能在靶生物分子上共同部位結(jié)合的小分子配體家族。可以應(yīng)用多種篩選方法獲得對一個靶標(biāo)具有高親和力而對于另一個密切相關(guān)的靶標(biāo)具有顯著較弱親和力的配體。一種篩選策略是在平行實(shí)驗(yàn)中鑒定這兩個生物分子的配體,接著通過交叉參考對比排除共同的配體。在該方法中,每個生物分子的配體都可以如以上所述單獨(dú)鑒定。該方法既適合于固定的靶生物分子也適合于在溶液中游離的耙生物分子。對于固定的靶生物分子,另外一種策略是增加一個從文庫中排除與非靶生物分子結(jié)合的所有配體的預(yù)選步驟。例如,第一生物分子可以如上所述與文庫接觸。然后從形成的任何第一生物分子-配體復(fù)合物中分離不與第一生物分子結(jié)合的化合物。然后第二生物分子接觸不與第一生物分子結(jié)合的化合物。與第二生物分子結(jié)合的化合物可以如上所述鑒定,它們對于第二生物分子比對于第一生物分子具有顯著較高的親和力。也可以使用通過上述方法鑒定的具有未知功能的生物分子的配體,來確定該生物分子的生物功能。這是有利的,因?yàn)楸M管新的基因序列不斷鑒定,但是這些序列編碼的蛋白質(zhì)的功能和這些蛋白質(zhì)作為新藥發(fā)現(xiàn)及開發(fā)靶標(biāo)的有效性難以確定,并且可能是應(yīng)用基因組信息治療疾病的最大障礙。通過本發(fā)明所述方法獲得的耙標(biāo)特異性配體可以在全細(xì)胞生物測定或適當(dāng)?shù)膭游锬P椭袘?yīng)用,用于理解靶蛋白質(zhì)的功能和耙蛋白質(zhì)用于治療性干預(yù)的有效性。該方法也可證實(shí)耙標(biāo)特別適合小分子藥物發(fā)現(xiàn)。在一個實(shí)施方案中,本發(fā)明的文庫中的一種或多種化合物鑒定為特定生物分子的配體。然后可以在體外試一驗(yàn)中評價這些化合物與生物分子結(jié)合的能力。優(yōu)選地,合成結(jié)合化合物的功能部分,其不含寡核苷酸標(biāo)簽或連接體部分,并且評價這些功能部分與生物分子結(jié)合的能力。也可以用體外無細(xì)胞或基于細(xì)胞的試驗(yàn)評價功能部分與生物分子結(jié)合對生物分子功能的影響。對于具有已知功能的生物分子,該試驗(yàn)可以包括比較在存在及不存在配體的情況下生物分子的活性,例如,通過直才妄測定活性,如酶活性,或者通過間,接測定例如該生物分子影響的細(xì)胞功能。如果該生物分子具有未知的功能,則表達(dá)該生物分子的細(xì)胞可以接觸配體,并且評價該配體對該細(xì)胞的生存力、功能、表型和/或基因表達(dá)的影響。這樣的體外試驗(yàn)可以是,例如,細(xì)胞死亡測定、細(xì)胞增殖測定或病毒復(fù)制試驗(yàn)。例如,如果該生物分子是病毒表達(dá)的蛋白質(zhì),則感染病毒的細(xì)胞可以與該蛋白質(zhì)的配體接觸。然后可以評價該配體與蛋白質(zhì)的結(jié)合對病毒生存力的影響。利用本發(fā)明的方法鑒定的配體也可以在體內(nèi)模型中或在人體內(nèi)進(jìn)可以測定動物或生物體在健康狀態(tài)(例如疾病進(jìn)展)上發(fā)生的任何變化。對于一種未知功能的生物分子,如蛋白質(zhì)或核酸分子,與生物分子結(jié)合的配體對產(chǎn)生該生物分子的細(xì)胞或生物體的影響可以提供關(guān)于該生物分子生物功能的信息。例如,觀察到特定細(xì)胞過程在配體存在下受到抑制,指示該過程至少部分依賴于該生物分子的功能。的親和試劑。在一個實(shí)施方案中,利用這樣的配體實(shí)現(xiàn)生物分子的親和純化,例如,通過利用連接有一種或多種這樣的配體的固相對含有該生物分子的溶液進(jìn)行層析。通過下面的實(shí)施例進(jìn)一步說明本發(fā)明,這些實(shí)施例不應(yīng)視為限制。在本申請全文中引用的所有參考文獻(xiàn)、專利和公布的專利申請以及附圖和序列表的內(nèi)容,都在此引用作為參考。實(shí)施例實(shí)施例1:成員數(shù)為105數(shù)量級的文庫的合成和表征含有105數(shù)量級的不同成員的文庫的合成使用下列試劑完成:化合物1:<formula>formulaseeoriginaldocumentpage65</formula>脫氧核糖核苷酸的單字母密碼:A二腺苷C=胞苷G=鳥苷T=胸苷結(jié)構(gòu)單元前體:BB2BB3BB7BB8BB9Fmoc、、'〇OHFmoc、,OHBB10BB11BB12寡核苷酸標(biāo)簽:序列5,-P04-GCAACGAAG(SEQIDNO:l)ACCGTTGCT-P03-5,(SEQIDNO:2)標(biāo)簽編號1.15'-P03-GCGTACAAG(SEQIDNO:3)ACCGCATGT-P03-5'(SEQIDNO:4)1.2FmoC\N=(門〕5,-P03-GCTCTGTAG(SEQIDNO:5)1.3ACCGAGACA-P03-5,(SEQIDNO:6)5'-P03-GTGCCATAG(SEQIDNO:7)1.4ACCACGGTA-P03-5,(SEQIDNO:8)5,-P03-GTTGACCAG(SEQIDNO:9)1.5ACCAACTGG-P03-5,(SEQIDNO:10)5'-P03-CGACTTGAC(SEQIDNO:ll)1.6CAAGTCGCA-P03-5,(SEQIDNO:12)5'-P03-CGTAGTCAG(SEQIDNO:13)1.7ACGCATCAG-P03-5,(SEQIDNO:14)5'-P03-CCAGCATAG(SEQIDNO:15)1.8ACGGTCGTA-P03-5,(SEQIDNO:16)5'-P03-CCTACAGAG(SEQIDNO:17)1.9ACGGATGTC-P03-5,(SEQIDNO:18)5,-P03-CTGAACGAG(SEQIDNO:19)1.10CGTTCAGCA-P03-5'(SEQIDNO:20)5,-P03-CTCCAGTAG(SEQIDNO:21)U1ACGAGGTCA-P03-5'(SEQIDNO:22)5'-P03-TAGGTCCAG(SEQIDNO:23)1.12ACATCCAGG-P03-5'(SEQIDNO:24)5'-P03-GCGTGTTGT(SEQIDNO:25)2.1TCCGCACAA-P03-5,(SEQIDNO:26)5'-P03-GCTTGGAGT(SEQIDNO:27)2.2TCCGAACCT-P03-5'(SEQIDNO:28)5,-P03-GTCAAGCGT(SEQIDNO:29)2.3TCCAGTTCG-P〇3-5'(SEQIDNO:30)5,-P03-CAAGAGCGT(SEQIDNO:31)2.4TCGTTCTCG-P03-5'(SEQIDNO:32)5'-P03-CAGTTCGGT(SEQIDNO:33)2.5TCGTCAAGC-P03-5,(SEQIDNO:34)5,-P03-CGAAGGAGT(SEQIDNO:35)2.6TCGCTTCCT-P03-5,(SEQIDNO:36)5'-P03-CGGTGTTGT(SEQIDNO:37)2.7TCGCCACAA-P03-5'(SEQIDNO:38)5'-P03-CGTTGCTGT(SEQIDNO:39)2.8TCGCAACGA-P03-5'(SEQIDNO:40)5,-P03-CCGATCTGT(SEQIDNO:41)2.9TCGGCTAGA-P03-5'(SEQIDNO:42)5'-P03-CCTTCTCGT(SEQIDNO:43)2.10TCGGAAGAG-P03-5'(SEQIDNO:44)5'-P03-TGAGTCCGT(SEQIDNO:45)2.11TCACTCAGG-P03-5,(SEQIDNO:46)5'-POrTGCTACGGT(SEQIDNO:47)2.12TCAGATTGC-P03-5'(SEQIDNO:48)5'-P03-GTGCGTTGA(SEQIDNO:49)3.1CACACGCAA-P03-5'(SEQIDNO:50)5,-P03-GTTGGCAGA(SEQIDNO:51)3.2CACAACCGT-P03-5'(SEQIDNO:52)5,-P03-CCTGTAGGA(SEQIDNO:53)3.3CAGGACATC-P03-5,(SEQIDNO:54)5'-P03-CTGCGTAGA(SEQIDNO:55)3.4CAGACGCAT-P03-5'(SEQIDNO:56)<formula>formulaseeoriginaldocumentpage69</formula>5'-P03-CATACGCTT(SEQIDNO:83)4.6CTGTATGCG-P03-5'(SEQIDNO:84)5,-P03-CGATCTGTT(SEQIDNO:85)4.7CTGCTAGAC-P03-5,(SEQIDNO:86)5,-P03-CGCTTTGTT(SEQIDNO:87)4.8CTGCGAAAC-P03-5,(SEQIDNO:88)5,-P03-CCACAGTTT(SEQIDNO:89)4.9CTGGTGTCA-P03-5,(SEQIDNO:90)5,-P03-CCTGAAGTT(SEQIDNO:91)4.10CTGGACTTC-P03-5,(SEQIDNO:92)5,-P03-CTGACGATT(SEQIDNO:93)4.11CTGACTGCT-P03-5,(SEQIDNO:94)5'-P03-CTCCACTTT(SEQIDNO:95)4.12CTGAGGTGA-P03-5'(SEQIDNO:96)5,-P03-ACCAGAGCC(SEQIDNO:97)5.1AATGGTCTC-P03-5,(SEQIDNO:98)5,-P03-ATCCGCACC(SEQIDNO:99)5.2AATAGGCGT-P03-5'(SEQIDNO:IOO)5,-P03-GACGACACC(SEQIDNO:101)5.3AACTGCTGT-P03-5'(SEQIDNO:102)5,-P03-GGATGGACC(SEQIDNO:103)5.4AACCTACCT-P03-5,(SEQIDNO:104)5'-P03-GCAGAAGCC(SEQIDNO:105)5.5AACGTCTTC-P03-5'(SEQIDNO:106)5,-P03-GCCATGTCC(SEQIDNO:107)5.6AACGGTACA-P03-5'(SEQIDNO:108)5,-P03-GTCTGCTCC(SEQIDNO:109)5.7AACAGACGA-P03-5,(SEQIDNO:l10)5,-P03-CGACAGACC(SEQIDNO:111)5.8AAGCTGTCT-P03-5,(SEQIDNO:l12)5,-P03-CGCTACTCC(SEQIDNO:113)5.9AAGCGATGA-P03-5'(SEQIDNO:114)5'-P03-CCACAGACC(SEQIDNO:115)5.10AAGGTGTCT-P03-5'(SEQIDNO:l16)5'-P03-CCTCTCTCC(SEQIDNO:l17)5,11AAGGAGAGA-P03-5'(SEQIDNO:l18)5,-P03-CTCGTAGCC(SEQIDNO:l19)5.12AAGAGCATC-P03-5'(SEQIDNO:120)lx連接酶緩沖液50mMTris,pH7.5;10mM二硫蘇糖醇;10mMMgCl2;2.5mMATP;50mMNaCl。lOx連接酶緩沖液500mMTris,pH7.5;100mM二硫蘇糖醇;100mMMgCl2;25mMATP;500mMNaCl。循環(huán)1向12個PCR管的每一個中加入50jliL1mM化合物1的水溶液;75^L0.80mM標(biāo)簽1.1-1.12之一的溶液;15|aL10x連接酶緩沖液和10去離子水。將這些管加熱到95°C1分鐘,然后冷卻到16°C10分鐘。向每個管中加入在50|allx連接酶緩沖液中的5,000單位的T4DNA連接酶(2.5|aL,2,000,000單位/mL溶液(NewEnglandBiolabs,目錄號M0202)),獲得的溶液在16°C下溫育16小時。連接后,將樣品轉(zhuǎn)移到1,5mlEppendorf管中,用205MNaCl水溶液和500pL冷(-20。C)乙醇處理,在-20。C下保持1小時。離心后,棄去上清液,用70。/。乙醇水溶液在-20。C下洗滌沉淀物。然后將每個沉淀物溶解于150jaL150mM硼酸鈉緩沖液,pH9.4中。在DMF中制備含有濃度分別為0.25M的結(jié)構(gòu)單元前體BB1至BB12之一、N,N-二異丙基乙醇胺和0-(7-氮雜苯并三唑-1-基)-1,1,3,3-四曱基脲六氟磷酸的貯存液,并在室溫下攪拌20分鐘。向上述每個沉淀溶液中添加結(jié)構(gòu)單元前體溶液,以才是供相對于連3妻體IO倍過量的結(jié)構(gòu)單元前體。攪拌獲得的溶液。20分鐘后向反應(yīng)混合物中加入另外10個當(dāng)量的結(jié)構(gòu)單元前體,40分鐘后加入另外10個當(dāng)量。DMF在反應(yīng)混合物中的終濃度為22%。然后在4。C下攪拌反應(yīng)溶液過夜。使用50mM乙酸四乙銨水溶液(pH二7.5)和乙腈,和2-46%乙腈的梯度,通過RP-HPLC在14分鐘內(nèi)監(jiān)測反應(yīng)的進(jìn)展。當(dāng)約95%的起始材料(連接體)被酰化時終止反應(yīng)。?;蠛喜⒎磻?yīng)混合物,并凍干至干燥。然后通過HPLC純化凍干的物質(zhì),合并對應(yīng)于文庫的級分(?;a(chǎn)物),并凍干。將該文庫溶解于2.5ml0.01M磷酸鈉緩沖液(pH=8.2)中,向其中加入O.lml艱咬(4%v/v)。加入哌啶產(chǎn)生在混合時不溶解的混濁。將反應(yīng)混合物在室溫下攪拌50分鐘,然后離心(14,000rpm)混濁的溶液,用200pl移液管除去上清液,將沉淀物重懸浮于0.1ml水中。含水洗液與上清液混合,棄去沉淀。通過加入過量的冰冷的乙醇使乙醇在反應(yīng)液中的終濃度為70%v/v,從溶液中沉淀脫保護(hù)的文庫。離心含水乙醇混合物,產(chǎn)生含有該文庫的白色沉淀物。用冷70%乙醇水溶液洗滌沉淀物一次。除去溶劑后,使沉淀物風(fēng)干(約5分鐘),以除去痕量的乙醇,然后在循環(huán)2中使用。在第1輪中使用的標(biāo)簽和相應(yīng)的結(jié)構(gòu)單元前體在下面的表1中列出。表1<table>tableseeoriginaldocumentpage72</column></row><table>BB6BB7BB8BB9BB10BB11BB121.101.121.51.41.31.71.9循環(huán)2-5對于其中每一個循環(huán),將前一循環(huán)產(chǎn)生的混合的溶液分成12等份,每份50^U,置于PCR管中。向每管中加入含有不同標(biāo)簽的溶液,除循環(huán)3-5省略循環(huán)1所述的HPLC純化步驟之外,如循環(huán)1所述進(jìn)行連接、純化和?;?。用于循環(huán)2-5的標(biāo)簽與結(jié)構(gòu)單元前體的對應(yīng)關(guān)系在表2中給出。利用以上所述的標(biāo)簽連接的方法,將循環(huán)5的產(chǎn)物與以下所示的封閉引物連接。5,-P03-GGCACATTGATTTGGGAGTCAGTGTAACTAAACCCTCAGT-P03-5'表2結(jié)構(gòu)單元循環(huán)2循環(huán)3循環(huán)4循環(huán)5前體標(biāo)簽標(biāo)簽標(biāo)簽標(biāo)簽BB12.73.74.75.7BB22.83.84.85.8BB32.23.24.25.2BB42.103.104.105.10BB52.13.14.15.1BB62.123.124.125.12BB72.53.54.55.5BB82.63.64.65.6BB92.43.44.45.4BB102.33.34.35,3BB112.93.94.95.9BB122.113.114,115.11脫氧核糖核苷酸的單芋母密碼:A=腺苷C=胞苷G=鳥苷T=胸普結(jié)構(gòu)單元前體結(jié)果上述合成過程具有產(chǎn)生含有125(約249,000)個不同結(jié)構(gòu)的文庫的能力。通過對每一循環(huán)的產(chǎn)物進(jìn)行凝膠電泳,監(jiān)測文庫的合成。5個循環(huán)中每一個的結(jié)果和封閉引物連接后的最終文庫在圖7中顯示。標(biāo)為"頭片"的化合物是化合物1。該圖顯示每個循環(huán)導(dǎo)致預(yù)期的分子量增加,每一循環(huán)的產(chǎn)物在分子量上基本均勻。實(shí)施例2:成員數(shù)為108數(shù)量級的文庫的合成和表征含有108數(shù)量級的不同成員的文庫的合成使用下列試劑實(shí)現(xiàn)化合物2:<formula>formulaseeoriginaldocumentpage74</formula><formula>formulaseeoriginaldocumentpage75</formula><formula>formulaseeoriginaldocumentpage76</formula><formula>formulaseeoriginaldocumentpage77</formula><formula>formulaseeoriginaldocumentpage78</formula><formula>formulaseeoriginaldocumentpage79</formula><formula>formulaseeoriginaldocumentpage80</formula>表3:循環(huán)1中使用的寡核苷酸標(biāo)簽:標(biāo)簽編號頂鏈序列5'-P03-AAATCGATGTGGTCACTCAG1.1(SEQIDNO:121)5,-P03-AAATCGATGTGGACTAGGAG1.2(SEQIDNO:123)5'-P03-AAATCGATGTGCCGTATGAG1.3(SEQIDNO:125)5'-P03-AAATCGATGTGCTGAAGGAG1.4(SEQIDNO:127)5'-P03-AAATCGATGTGGACTAGCAG1.5(SEQIDNO:129)5,-P03-AAATCGATGTGCGCTAAGAG1.6(SEQIDNO:131)5'-P03-AAATCGATGTGAGCCGAGAG1.7(SEQIDNO:133)5'匿P03-AAATCGATGTGCCGTATCAG5'-P03-GATACGGCACATCGATTTGG1.8(SEQIDNO:135)(SEQIDNO:136)5'-P03-AAATCGATGTGCTGAAGCAG5'-P03-GCTTCAGCACATCGATTTGG1.9(SEQIDNO:137)(SEQIDNO:138)5'-P03-AAATCGATGTGTGCGAGTAG5'-P03-ACTCGCACACATCGATTTGG1.10(SEQIDNO:139)(SEQIDNO:140)5'匿P03-AAATCGATGTGTTTGGCGAG5'-P03-CGCCAAACACATCGATTTGG1.1(SEQIDNO:141)(SEQIDNO:142)5'-P03-AAATCGATGTGCGCTAACAG5,-P03-GTTAGCGCACATCGATTTGG1.12(SEQIDNO:143)(SEQIDNO:144)5'-P03-AAATCGATGTGAGCCGACAG5'-P03-GTCGGCTCACATCGATTTGG1,13(SEQIDNO:145)(SEQIDNO:146)5,-P03-AAATCGATGTGAGCCGAAAG5,-P03-TTCGGCTCACATCGATTTGG1.14(SEQIDNO:147)(SEQIDNO:148)5,-P03-AAATCGATGTGTCGGTAGAG5,-P03-CTACCGACACATCGATTTGG1.15(SEQIDNO:149)(SEQIDNO:150)5'-P03-AAATCGATGTGGTTGCCGAG5,-P03-CGGCAACCACATCGATTTGG.16(SEQIDNO:151)(SEQIDNO:152)5'匿P03-AAATCGATGTGAGTGCGTAG5'-P03-ACGCACTCACATCGATTTGG1,17(SEQIDNO:153)(SEQIDNO:154)5,-P03-AAATCGATGTGGTTGCCAAG5,-P03-TGGCAACCACATCGATTTGG1.18(SEQIDNO:155)(SEQIDNO:156)5'-P03-AAATCGATGTGTGCGAGGAG5,-P03-CCTCGCACACATCGATTTGGU9(SEQIDNO:157)(SEQIDNO:158)5'-P03-AAATCGATGTGGAACACGAG5,-P03-CGTGTTCCACATCGATTTGG1.20(SEQIDNO:159)(SEQIDNO:160)5'-P03-AAATCGATGTGCTTGTCGAG5,-P03-CGACAAGCACATCGATTTGG1.21(SEQIDNO:161)(SEQIDNO:162)5'-P03-AAATCGATGTGTTCCGGTAG5'-PO3-A0CCGGAACACATCGATTTGG1.22(SEQIDNO:163)(SEQIDNO:164)5,-P03-AAATCGATGTGTGCGAGCAG5'-P03-GCTCGCACACATCGATTTGG1.23(SEQIDNO:165)(SEQIDNO:166)5,-P03-AAATCGATGTGGTCAGGTAG5'匿P03-ACCTGACCACATCGATTTGG1.24(SEQIDNO:167)(SEQIDNO:168)5,-P03-AAATCGATGTGGCCTGTTAG5'-P03-AACAGGCCACATCGATTTGG].25(SEQIDNO:169)(SEQIDNO:170)5,-P03-AAATCGATGTGGAACACCAG5'-P03-GGTGTTCCACATCGATTTGG1.26(SEQIDNO:171)(SEQIDNO:172)1.275'-P03-AAATCGATGTGCTTGTCCAG5'-P03-GGACAAGCACATCGATTTGG(SEQIDNO:173)5,-P03-AAATCGATGTGTGCGAGAAG1.28(SEQIDNO:175)5'-P03-AAATCGATGTGAGTGCGGAG1.29(SEQIDNO:177;)5,-P03-AAATCGATGTGTTGTCCGAG1.30(SEQIDNO:179)5,-P03-AAATCGATGTGTGGAACGAG1.31(SEQIDNO:181)5'-P03-AAATCGATGTGAGTGCGAAG1.32(SEQIDNO:183)5,-P03-AAATCGATGTGTGGAACCAG1.33(SEQIDNO:185)5'-P03-AAATCGATGTGTTAGGCGAG1.34(SEQIDNO:187)5,-P03-AAATCGATGTGGCCTGTGAG1.35(SEQIDNO:189)5'-P03-AAATCGATGTGCTCCTGTAGU6(SEQIDNO:191)_(SEQIDNO:174)5'-P03-TCTCGCACACATCGATTTGG(SEQIDNO:176)5,-P03-CCGCACTCACATCGATTTGG(SEQIDNO:178)5,-P03-CGGACAACACATCGATTTGG(SEQIDNO:180)5,-P03-CGTTCCACACATCGATTTGG(SEQIDNO:182)5,-P03-TCGCACTCACATCGATTTGG(SEQIDNO:184)5'-P03-GGTTCCACACATCGATTTGG(SEQIDNO:186)5,-P03-CGCCTAACACATCGATTTGG(SEQIDNO:188)5,-P03-CACAGGCCACATCGATTTGG(SEQIDNO:190)5'-P03-ACAGGAGCACATCGATTTGG(SEQIDNO:192)_5'-P03-AAATCGATGTGGTCAGGCAG1.37(SEQIDNO:193)5'-P03-AAATCGATGTGGTCAGGAAG1.38(SEQIDNO:195)5'-P03-AAATCGATGTGGTAGCCGAG1.39(SEQIDNO:197)5,-P03-AAATCGATGTGGCCTGTAAG1.40(SEQIDNO:199)5'-P03-AAATCGATGTGCTTTCGGAG1.4(SEQIDNO:201)5'-P03-AAATCGA丁GTGCGTAAGGAG1.42(SEQIDNO:203)5'-P03-AAATCGATGTGAGAGCGTAG1.43(SEQIDNO:205)5'-P03-AAATCGATGTGGACGGCAAG1.44(SEQIDNO:207)5,-P03-AAATCGATGTGCTTTCGCAG1.45(SEQIDNO:209)5'-P03-AAATCGATGTGCGTAAGCAG.46(SEQIDNO:211)5,-P03-GCCTGACCACATCGATTTGG(SEQIDNO:194)5'-P03-TCCTGACCACATCGATTTGG(SEQIDNO:196)5,-P03-CGGCTACCACATCGATTTGG(SEQIDNO:198)5'-P03-TACAGGCCACATCGATTTGG(SEQIDNO:200)5,-P03-CCGAAAGCACATCGATTTGG(SEQIDNO:202)5'-P03-CCTTACGCACATCGATTTGG(SEQIDNO:204)5'-P03-ACGCTCTCACATCGATTTGG(SEQIDNO:206)5'-P03-TGCCGTCCACATCGATTTGG(SEQIDNO:208)5'-P03-GCGAAAGCACATCGATTTGG(SEQIDNO:210:)5'-P03-GCTTACGCACATCGATTTGG(SEQIDNO:212)<table>tableseeoriginaldocumentpage83</column></row><table><formula>formulaseeoriginaldocumentpage84</formula>(SEQIDNO:289)5,-P03-AAATCGATGTGTCGTCCAAG1.86(SEQIDNO:291)5'-P03-AAATCGATGTGGACGGAGAG1.87(SEQIDNO:293)5,-P03-AAATCGATGTGGTAGCAGAG1.88(SEQIDNO:295)5'-P03-AAATCGATGTGGCTGTGTAG1.89(SEQIDNO:297)5'-P03-AAATCGATGTGGACGGACAGl.卯(SEQIDNO:299)5'-P03-AAATCGATGTGTCAGGCAAG1.91(SEQIDNO:301)5'-P03-AAATCGATGTGGCTCGAAAG1.92(SEQIDNO:303)5'-P03-AAATCGATGTGCCTTCGGAG1.93(SEQlDNO:305)5,-P03-AAATCGATGTGGTAGCACAG1.94(SEQIDNO:307)5'-P03-AAATCGATGTGGAAGGTCAG1.95(SEQIDNO:309)5'-P03-AAATCGATGTGGTGCTGTAG1.96(SEQIDNO:311)_(SEQIDNO:290)5,-P03-TGGACGACACATCGATTTGG(SEQIDNO:292)5,-P03-CTCCGTCCACATCGATTTGG(SEQIDNO:294)5,-P03-CTGCTACCACATCGATTTGG(SEQIDNO:296)5'-P03-ACACAGCCACATCGATTTGG(SEQIDNO:298)5'-P03-GTCCGTCCACATCGATTTGG(SEQIDNO:300;)5,-P03匿TGCCTGACACATCGATTTGG(SEQIDNO:302)5,—P03-TTCGAGCCACATCGATTTGG(SEQIDNO:304)5'-P03-CCGAAGGCACATCGATTTGG(SEQIDNO:306)5,-P03-GTGCTACCACATCGATTTGG(SEQIDNO:308)5,-P03-GACCTTCCACATCGATTTGG(SEQIDNO:310)5,-P03-ACAGCACCACATCGATTTGG(SEQIDNO:312)_表4:循環(huán)2中使用的寡核苷酸標(biāo)簽:標(biāo)簽編號頂鏈序列2.15,-P03-GTTGCCTGT(SEQIDNO:313)5,-P03-CAGGACGGT2.2(SEQIDNO:315)5'-P03-AGACGTGGT2.3(SEQIDNO:317)5'-P03-CAGGACCGT2.4(SEQIDNO:319)5,-P03-CAGGACAGT2.5(SEQIDNO:321)底鏈序列5'-P03-AGGCAACCT(SEQIDNO:314)5'-P03-CGTCCTGCT(SEQIDNO:316)5'-P03-CACGTCTCT(SEQIDNO:318)5,-P03-GGTCCTGCT(SEQIDNO:320)5'-P03-TGTCCTGCT(SEQIDNO:322)5'-P03-CACTCTGGT5'-P03-CAGAGTGCT2.6(SEQIDNO:323)(SEQIDNO:324)5'-P03-GACGGCTGT5,-P03-AGCCGTCCT2.7(SEQIDNO:325)(SEQIDNO:326)5'-P03-CACTCTCGT5'-P03-GAGAGTGCT2.8(SEQIDNO:327)(SEQIDNO:328)5'-P03-GTAGCCTGT5'-P03-AGGCTACCT2.9(SEQIDNO:329)(SEQIDNO:330)5,-P03-GCCACTTGT5,-P03-AAGTGGCCT2.10(SEQIDNO:331)(SEQIDNO:332)5'-P03-CATCGCTGT5'-P03-AGCGATGCT2.11(SEQIDNO:333)(SEQIDNO:334)5'-P03-CACTGGTGT5'-P03-ACCAGTGCT2.12(SEQIDNO:335)(SEQIDNO:336)5'-P03-GCCACTGGT5,-P03-CAGTGGCCT2.13CSEQIDNO:337)(SEQIDNO:338)5'-P03-TCTGGCTGT5,-P03-AGCCAGACT2.14(SEQIDNO:339)(SEQIDNO:340)5,-P03-GCCACTCGT5'-P03匿GAGTGGCCT2.15(SEQIDNO:341)(SEQIDNO:342)5,-P03-TGCCTCTGT5,-P03-AGAGGCACT2.16(SEQIDNO:343)(SEQIDNO:344)5'-P03-CATCGCAGT5,-P03-TGCGATGCT2.17CSEQIDNO:345)(SEQIDNO:346)5'-P03-CAGGAAGGT5,-P03-CTTCCTGCT2.18(SEQIDNO:347)(SEQIDNO:348)5'-P03-GGCATC丁GT5'-P03-AGATGCCCT2.19(SEQIDNO:349)(SEQIDNO:350)5'-P03-CGGTGCTGT5,-P03-AGCACCGCT2.20(SEQIDNO:351)(SEQIDNO:352)5'-P03-CACTGGCGT5'匿P03-GCCAGTGCT2.21(SEQIDNO:353)(SEQIDNO:354)5,一P03-TCTCCTCGT5,-P03-GAGGAGACT2.22(SEQIDNO:355)(SEQIDNO:356)5'-P03-CCTGTCTGT5,-P03-AGACAGGCT2.23CSEQIDNO:357)(SEQIDNO:358;)5'-P03-CAACGCTGT5'-P03-AGCGT丁GCT2.24(SEQIDNO:359)(SEQIDNO:360)2.255,-P03-TGCCTCGGT5'-P03-CGAGGCACT(SEQIDNO:361)(SEQIDNO:362)5,-P03-ACACTGCGT5,-P03-GCAGTGTCT2.26(SEQIDNO:363)(SEQIDNO:364)5'—P03習(xí)TCGTCCTGT5,-P03-AGGACGACT2.27(SEQIDNO:365)(SEQIDNO:366)5'-P03-GCTGCCAGT5'-P03-TGGCAGCCT2.28(SEQIDNO:367)(SEQIDNO:368)5,-P03-TCAGGCTGT5,-P03-AGCCTGACT2.29(SEQIDNO:369)(SEQIDNO:370)5'-P03-GCCAGGTGT5,-P03-ACCTGGCCT2.30(SEQIDNO:371)(SEQIDNO:372)5'-P03-CGGACCTGT5,-P03-AGGTCCGCT2.31(SEQIDNO:373)(SEQIDNO:374)5'-P03-CAACGCAGT5'-P03-丁GCGTTGCT2.32(SEQIDNO:375)(SEQIDNO:376)5,-P03-CACACGAGT5'.P03-TCGTGTGCT2.33(SEQIDNO:377)(SEQIDNO:378)5,-P03-ATGGCCTGT5,-P03-AGGCCATCT2.34(SEQIDNO:379)(SEQIDNO:380)5,-P03-CCAGTCTGT5'-P03-AGACTGGCT2.35(SEQIDNO:381)(SEQIDNO:382)5'-P03-GCCAGGAGT5'-P03-TCCTGGCCT2.36(SEQIDNO:383)(SEQIDNO:384)5'-P03-CGGACCAGT5'-P03-TGGTCCGCT2.37(SEQIDNO:385)(SEQIDNO:386)5'-P03-CCTTCGCGT5'-P03-GCGAAGGCT2.38(SEQIDNO:387)(SEQIDNO:388)5,-P03-GCAGCCAGT5,-P03-TGGCTGCCT2.39(SEQIDNO:389)(SEQIDNO:390)5'-P03-CCAGTCGGT5,-P03-CGACTGGCT2.40(SEQIDNO:391)(SEQIDNO:392)5'-P03-ACTGAGCGT5'-P03-GCTCAGTCT2.41(SEQIDNO:393;)(SEQIDNO:394)5'-P03-CCAGTCCGT5,-P03-GGACTGGCT2.42(SEQIDNO:395)(SEQIDNO:396)5'-P03-CCAGTCAGT5'-P03-TGACTGGCT2.43(SEQIDNO:397)(SEQIDNO:398)5,-P03-CATCGAGGT5,-P03-CTCGATGCT2.44(SEQIDNO:399)(SEQIDNO:400)2.452.462.472.482.492.502.512,522.532.542.552.562.572.582.592.602.612.622.632.645廣P03-CCATCG,TG.T(SEQIDNO:401)5rp03-G,TG門TG門GT(SEQIDNO:403)5"-p03-GA門TTA門GGT(SEQIDNO:405)5廣P03-G叫GCTGAGT(SEQIDNO:407)5。,ipo3-G0:.rGCA.rG.T(SEQIDNO:409)(SEQIDNO:411)5廣P03-GA門-TAC門G,T(SEQIDNO:413)(SEQIDNO:415)(SEQIDNO:417)(SEQIDNO:419)5。-p03-AG門ACTGG,T(SEQIDNO:421)5。,P03-T門GCTTGGT(SEQIDNO:423)5,P03-AG門A門,T門G叫(SEQIDNO:425)5-,p03-G門GArTGGT(SEQIDNO:427)5。-lp03-門門AT門G門GT(SEQIDNO:429)5,P03-TCGCTT門GT(SEQIDNO:431)(SEQIDNO:433)5ZP03-GG門ATTAGGTT(SEQIDNO:435)(SEQIDNO:437)5。,P03-TG門GA門GGT(SEQIDNO:402)y-po3-G門AG門AC:門,T(SEQIDNO:404)^-^03-門G,TAGT門門TT(SEQIDNO:406)5,P03-T門AG門A門門T(SEQIDNO:408)(SEQIDNO:410)5"-p03-ACCACT門門,T(SEQIDNO:412)5廣P03-GGTAGT門門,T(SEQIDNO:414)(SEQIDNO:416)(SEQIDNO:418)、-1-03-門叫門門>0>門叫(SEQIDNO:420)5廣P03-門AG,TGCT門T(SEQIDNO:422)5"-po3-CAAG門GACT(SEQIDNO:424)(SEQIDNO:426)(SEQIDNO:428)5一-po3-G門GA,TGG門T(SEQIDNO:430)5廣P03-GAAG門GA門,T(SEQIDNO:432)5"-po3-AGG門A門,T門T(SEQIDNO:434)(SEQIDNO:436)「-p03-GAA叫門G門CT(SEQIDNO:438)「-po3-CGTT門G門A門T(SEQIDNO:439)(SEQIDNO:440)5'-P03-GAGTGGCGT5'-P03-GCCACTCCT2.65(SEQIDNO:441)(SEQIDNO:442)5'-P03-CGGTGAGG丁5'-P03-CTCACCGC丁2.66(SEQIDNO:443)(SEQIDNO:444)5'-P03-GCTGCAAGT5'-P03-TTGCAGCCT2.67(SEQIDNO:445)(SEQIDNO:446;)5'-P03-TTCCGCTGT5'-P03-AGCGGAACT2.68(SEQIDNO:447)(SEQIDNO:448)5'-P03-GAGTGGAGT5'-P03-TCCACTCCT2.69(SEQIDNO:449)(SEQIDNO:450)5'-P03-ACAGAGCGT5,-P03-GCTCTGTCT2.70(SEQIDNO:451)(SEQIDNO:452)5'-P03-TGCGACCGT5'-P03-GGTCGCACT2.71(SEQIDNO:453)(SEQIDNO:454)5'-P03-CCTGTAGGT5,-P03-CTACAGGCT2.72(SEQIDNO:455)(SEQIDNO:456)5'匿P03-TAGCCGTGT5'-P03-ACGGCTACT2.73(SEQIDNO:457)(SEQIDNO:458)5'-P03-TGCGACAGT5'-P03-TGTCGCACT2.74(SEQIDNO:459)(SEQIDNO:460)5'-P03-GGTCTGTGT5,-P03-ACAGACCCT2.75(SEQIDNO:461)(SEQIDNO:462)5'-P03-CGGTGAAGT5'-P03-TTCACCGCT2.76(SEQIDNO:463)(SEQIDNO:464)5,-P03-CAACGAGGT5'-P03-CTCGTTGCT2.77(SEQIDNO:465)(SEQIDNO:466)5'-P03-GCAGCATGT5'-P03-ATGC丁GCCT2.78(SEQIDNO:467)(SEQIDNO:468)5'-P03-TCGTCAGGT5,-P03-CTGACGACT2.79(SEQIDNO:469)(SEQIDNO:470)5'-P03-AGTGCCAGT5,-P03-TGGCACTCT2.80(SEQIDNO:471)(SEQIDNO:472)5'-P03-TAGAGGCGT5'-P03-GCCTCTACT2.81(SEQIDNO:473)(SEQIDNO:474)5'-P03-GTCAGCGGT5'-P03-CGCTGACCT2.82(SEQIDNO:475)(SEQIDNO:476)5'-P03-TCAGGAGGT5,-P03-CTCCTGACT2.83(SEQIDNO:477)(SEQIDNO:478)2.845'-P03-AGCAGGTGT(SEQIDNO:4795'-P03-ACCTGCTCT(SEQIDNO:480)5'-P03-TTCCGCAGT5'-P03-TGCGGAACT2.85(SEQIDNO:481)(SEQIDNO:482)5'-P03-GTCAGCCGT5'-P03-GGCTGACCT2.86(SEQIDNO:483)(SEQIDNO:484)5'-P03-GGTCTGCG丁5'-P03-GCAGACCCT2.87(SEQIDNO:485)(SEQIDNO:486)5'-P03-TAGCCGAGT5'一P03-TCGGCTACT2.88(SEQIDNO:487)(SEQIDNO:488)5'-P03-GTCAGCAGT5'-P03-TGCTGACCT2.89(SEQIDNO:489)(SEQIDNO:490)5'-P03-GGTCTGAGT5'-P03-TCAGACCCT2"0(SEQIDNO:491)(SEQIDNO:492)5'-P03-CGGACAGGT5'-P03-CTGTCCGCT2,91(SEQIDNO:493)(SEQIDNO:494)5'-P03-TTAGCCGGT5'-P03-3'5'-P03-CGGCTAACT5'-P03-3'2.92(SEQIDNO:495)(SEQIDNO:496)5'-P03-GAGACGAGT5,-P03-TCGTCTCCT2.93(SEQIDNO:497)(SEQIDNO:498)5,-P03-CGTAACCGT5'-P03-GGTTACGCT2.94(SEQIDNO:499)(SEQIDNO:500)5'-P03-TTGGCGTGT5'-P03-3'5'-P03-ACGCCAACT5'-P03-3'2.95(SEQIDNO:501)(SEQIDNO:502)5'-P03-ATGGCAGGT5'-P03-CTGCCATCT2.96(SEQIDNO:503)(SEQIDNO:504)表5.循環(huán)3中使用的寡核苷酸標(biāo)簽標(biāo)簽編號頂鏈序列底鏈序列3.23.33.45'-P03-CAGCTACGA(SEQIDNO:505)5,-P03-CTCCTGCGA(SEQIDNO:507)5,-P03-GCTGCCTGA(SEQIDNO:509)5'-P03-CAGGAACGA5'-P03-GTAGCTGAC(SEQIDNO:506)5'匿P03-GCAGGAGAC(SEQIDNO:508)5'-P03-AGGCAGCAC(SEQIDNO:510)5'-P03-GTTCCTGAC3.63.73.83.9U03.113.123.133.143.153.163.173.18.193.20.213.223.23(SEQIDNO:511)5,-P03-CACACGCGA(SEQIDNO:513)5,-P03-GCAGCCTGA(SEQIDNO:515)5'-P03-CTGAACGGA(SEQIDNO:517)5,-P03-CTGAACCGA(SEQIDNO:519)5,-P03-TCTGGACGA(SEQIDNO:521)5'一P03匿TGCCTACGA(SEQIDNO:523)5'-P03-GGCATACGA(SEQIDNO:525)5,-P03-CGGTGACGA(SEQIDNO:527)(SEQIDNO:512)5'-P03-GCGTGTGAC(SEQIDNO:514)5'-P03-AGGCTGCAC(SEQIDNO:516)5,-P03-CGTTCAGAC(SEQIDNO:518)5'-P03-GGTTCAGAC(SEQIDNO:520)5'-P03-GTCCAGAAC(SEQIDNO:522)5,-P03-GTAGGCAAC(SEQIDNO:524)5'-P03-GTATGCCAC(SEQIDNO:526)5'-P03-GTCACCGAC(SEQIDNO:528)5,-P03-CAACGACGA(SEQIDNO:529)5'-P03-CTCCTCTGA(SEQIDNO:531)5'-P03-TCAGGACGA(SEQIDNO:533)5'-P03-AAAGGCGGA(SEQIDNO:535)5,-P03-CTCCTCGGA(SEQIDNO:537)5,-P03-CAGATGCGA(SEQIDNO:539)5'-P03-GCAGCAAGA(SEQIDNO:541)5'-P03-GTGGAGTGA(SEQIDNO:543)5'-P03-CCAGTAGGA(SEQIDNO:545)5'-P03-ATGGCACGA(SEQIDNO:547)5'-P03-GGACTGTGA(SEQIDNO:549)5,-P03-GTCGTTGAC(SEQIDNO:530)5'-P03-AGAGGAGAC(SEQIDNO:532)5'-P03-GTCCTGAAC(SEQIDNO:534)5,-P03-CGCCTTTAC(SEQIDNO:536)5,-P03-CGAGGAGAC(SEQIDNO:538)5'-P03-GCATCTGAC(SEQIDNO:540)5'-P03-丁TGCTGCAC(SEQIDNO:542)5,-P03-ACTCCACAC(SEQIDNO:544)5'-P03-CTACTGGAC(SEQIDNO:546)5'-P03-GTGCCATAC(SEQIDNO:548)5'-P03-ACAGTCCAC(SEQIDNO:550)5'-P03-CCGAACTGA5'-P03-AGTTCGGAC3.24(SEQIDNO:551)(SEQIDNO:552)5'-P03-CTCCTCAGA5'-P03-TGAGGAGAC3.25(SEQIDNO:553)(SEQIDNO:554)5'-P03-CACTGC丁GA5'-P03-AGCAGTGAC3.26(SEQIDNO:555)(SEQIDNO:556)5,-P03-AGCAGGCGA5'-P03-GCCTGCTAC3.27(SEQIDNO:557)(SEQIDNO:558)5'-P03-AGCAGGAGA5'-P03-TCCTGCTAC3.28(SEQIDNO:559)(SEQIDNO:560)5,-P03-AGAGCCAGA5'-P03-TGGCTCTAC3.29(SEQIDNO:561)(SEQIDNO:562)5'-P03-GTCGTTGGA5'-P03-CAACGACAC3.30(SEQIDNO:563)(SEQIDNO:564)5,-P03-CCGAACGGA5'-P03-CGTTCGGAC3.31(SEQIDNO:565)(SEQIDNO:566)5,-P03-CACTGCGGA5'-P03-CGCAGTGAC3.32(SEQIDNO:567)(SEQIDNO:568)5'-P03-GTGGAGCGA5'-P03-GCTCCACAC3.33(SEQIDNO:569)(SEQIDNO:570)5,-P03-GTGGAGAGA5,-P03-TCTCCACAC3.34(SEQIDNO:571)(SEQIDNO:572)5'-P03-GGACTGCGA5'-P03-GCAGTCCAC3.35(SEQIDNO:573)(SEQIDNO:574)5'-P03-CCGAACCGA5,-P03-GGTTCGGAC3.36(SEQIDNO:575)(SEQIDNO:576)5,-P03-CACTGCCGA5'-P03-GGCAGTGAC3.37(SEQIDNO:577)(SEQIDNO:578)5'-P03-CGAAACGGA5,-P03-CGTTTCGAC3.38(SEQIDNO:579)(SEQIDNO:580)5'-P03-GGACTGAGA5'-P03習(xí)TCAGTCCAC3.39(SEQIDNO:581)(SEQIDNO:582)5'-P03-CCGAACAGA5,-P03-TGTTCGGAC3.40(SEQIDNO:583)(SEQIDNO:584)5,-P03-CGAAACCGA5'P03-GGTTTCGAC3.41(SEQIDNO:585)(SEQIDNO:586)5'-P03-CTGGCTTGA5'-P03-AAGCCAGAC3.42(SEQIDNO:587)(SEQIDNO:588)3.435,-P03-CACACCTGA5'-P03-AGGTGTGAC(SEQIDNO:589)(SEQIDNO:590)5'-P03-AACGACCGA5'-P03-GGTCGTTAC3.44(SEQIDNO:591)(SEQIDNO:592)5'-P03-ATCCAGCGA5'-P03-GCTGGATAC3.45(SEQIDNO:593)(SEQIDNO:594)5'-P03-TGCGAAGGA5'-P03-CTTCGCAAC3.46(SEQIDNO:595)(SEQIDNO:596)5,-P03-TGCGAACGA5'-P03-GTTCGCAAC3.47(SEQIDNO:597)(SEQIDNO:598)5,-P03-CTGGCTGGA5'-P03-CAGCCAGAC3.48(SEQIDNO:599)(SEQIDNO:600)5,-P03-CACACCGGA5'-P03匿CGGTGTGAC3.49(SEQIDNO:601)(SEQIDNO:602)5'-P03-AGTGCAGGA5,-P03-CTGCACTAC3.50(SEQIDNO:603)(SEQIDNO:604)5,-P03-GACCGTTGA5,-P03-AACGGTCAC3.51(SEQIDNO:605;)(SEQIDNO:606)5'-P03-GGTGAGTGA5'-P03-ACTCACCAC3.52(SEQIDNO:607)(SEQIDNO:608)5'-P03-CCTTCCTGA5'-P03-AGGAAGGAC3.53(SEQIDNO:609)(SEQIDNO:610)5'-P03-CTGGCTAGA5'-P03-TAGCCAGAC3.54(SEQIDNO:611)(SEQIDNO:612)5,-P03-CACACCAGA5'—P03-TGGTGTGAC3.55(SEQIDNO:613)(SEQIDNO:614)5,-P03-AGCGGTAGA5'-P03-TACCGCTAC3.56(SEQIDNO:615)(SEQIDNO:616)5'-P03-GTCAGAGGA5,-P03-CTCTGACAC3.57(SEQIDNO:617)(SEQIDNO:618)5'-P03-TTCCGACGA5'-P03-GTCGGAAAC3.58(SEQIDNO:619)(SEQIDNO:620)5,-P03-AGGCGTAGA5'-P03-TACGCCTAC3.59(SEQIDNO:621)(SEQIDNO:622)5,-P03-CTCGACTGA5,-P03-AGTCGAGAC3.60(SEQIDNO:623)(SEQIDNO:624)5,-P03-TACGCTGGA5,-P03-CAGCGTAAC3.61(SEQIDNO:625)(SEQIDNO:626)5,-P03-GTTCGGTGA5,-P03-ACCGAACAC3.62(SEQIDNO:627)(SEQIDNO:628)5'-P03-GCCAGCAGA3.63(SEQIDNO:629)5,-P03-GACCGTAGA3.64(SEQIDNO:631)5,-P03-GTGCTCTGA3.65(SEQIDNO:633)5'-P03-GGTGAGCGA3.66(SEQIDNO:635)5'-P03-GGTGAGAGA3.67(SEQIDNO:637)5,-P03-CCTTCCAGA3.68(SEQIDNO:639)5'-P03-CTCCTACGA3.69(SEQIDNO:641)5'-P03-CTCGACGGA3.70(SEQIDNO:643)5'-P03-GCCGTTTGA3.71(SEQIDNO:645)5'-P03-GCGGAGTGA3.72_(SEQIDNO:647)5'-P03-TGCTGGCAC(SEQIDNO:630)5'-P03-TACGGTCAC(SEQIDNO:632)5'-P03-AGAGCACAC(SEQIDNO:634)5'-P03-GCTCACCAC(SEQIDNO:636)5,-P03-TCTCACCAC(SEQIDNO:638)5'-P03-TGGAAGGAC(SEQIDNO:640)5'-P03-GTAGGAGAC(SEQIDNO:642)5,-P03-CGTCGAGAC(SEQIDNO:644)5'-P03-AAACGGCAC(SEQIDNO:646)5,-P03-ACTCCGCAC(SEQIDNO:648)3.733.743.753.763.773.783.793.803.813.825'-P03-CGTGCTTGA(SEQIDNO:649)5'-P03-CTCGACCGA(SEQIDNO:651)5,-P03-AGAGCAGGA(SEQIDNO:653)5'-P03-GTGCTCGGA(SEQIDNO:655)5,-P03-CTCGACAGA(SEQIDNO:657)5'-P03-GGAGAGTGA(SEQIDNO:659)5,-P03-AGGCTGTGA(SEQIDNO:661)5,-P03-AGAGCACGA(SEQIDNO:663)5,-P03-CCATCCTGA(SEQIDNO:665)5'-P03-GTTCGGAGA5'-P03-AAGCACGAC(SEQIDNO:650)5'-P03-GGTCGAGAC(SEQIDNO:652)5'-P03-CTGCTCTAC(SEQIDNO:654)5,-P03-CGAGCACAC(SEQIDNO:656)5'-P03-TGTCGAGAC(SEQIDNO:658)5'-P03-ACTCTCCAC(SEQIDNO扁)5'-P03-ACAGCCTAC(SEQIDNO:662)5'-P03-GTGCTCTAC(SEQIDNO:664)5,-P03-AGGATGGAC(SEQIDNO:666)5'-P03-TCCGAACAC<table>tableseeoriginaldocumentpage95</column></row><table>表6.循環(huán)4中使用的寡核苷酸標(biāo)簽<table>tableseeoriginaldocumentpage95</column></row><table>5,-P03-ACTCTGCTT5,-P03-GCAGAGTTC4.3(SEQIDNO:701)(SEQIDNO:702)5,-P03-CATCGCCTT5,-P03-GGCGATGTC4.4(SEQIDNO:703)(SEQIDNO:704)5'-P03-GCCACTATT5,-P03-TAGTGGCTC4.5(SEQIDNO:705)(SEQIDNO:706)5'-P03-CACACGGTT5'-P03-CCGTGTGTC4.6(SEQIDNO:707)(SEQIDNO:708)5'-P03-CAACGCCTT5,-P03-GGCGTTGTC4.7(SEQIDNO:709)(SEQIDNO:710)5'-P03-ACTGAGGTT5'-P03-CCTCAGTTC4.8(SEQIDNO:711)(SEQIDNO:712)5'-P03-GTGCTGGTT5'-P03-CCAGCACTC4.9(SEQIDNO:713)(SEQIDNO:714)5,-P03-CATCGACTT5'-P03-GTCGATGTC4.10(SEQIDNO:715)(SEQIDNO:716)5'-P03-CCATCGGTT5,-P03-CCGATGGTC4.11(SEQIDNO:717)(SEQIDNO:718)5'-P03-GCTGCACTT5'-P03-G丁GCAGCTC4.12(SEQIDNO:719)(SEQIDNO:720)5,-P03-ACAGAGGTT5,-P03-CCTCTGTTC4.13(SEQIDNO:721)(SEQIDNO:722)5'-P03-AGTGCCGTT5'-P03-CGGCACTTC4.14(SEQIDNO:723)(SEQIDNO:724)5'-P03-CGGACATTT5,-P03-ATGTCCGTC4.15(SEQIDNO:725)(SEQIDNO:726)5'-P03-GGTCTGGTT5'-P03-CCAGACCTC4.16(SEQIDNO:727)(SEQIDNO:728)5,-P03-GAGACGGTT5'-P03-CCG丁CTCTC4.17(SEQIDNO:729)(SEQIDNO:730)5'-P03-CTTTCCGTT5,-P03-CGGAAAGTC4.18(SEQIDNO:731)(SEQIDNO:732)5'-P03-CAGATGGT丁5,-P03-CCATCTGTC4.19(SEQIDNO:733)(SEQIDNO:734)5'-P03-CGGACACTT5'-P03-GTGTCCGTC4.20(SEQIDNO:735)(SEQIDNO:736)5'-P03習(xí)ACTCTCGTT5,-P03-CGAGAGTTC4.21(SEQIDNO:737)(SEQIDNO:738)4.225'-P03-GCAGCACTT5'-P03-GTGCTGCTC<formula>formulaseeoriginaldocumentpage97</formula><formula>formulaseeoriginaldocumentpage98</formula>(SEQIDNO:817)4.62(SEQIDNO:819)「-p03-A門AGA門Grr4.63(SEQIDNO:821)4.64(SEQIDNO:823)4.65(SEQIDNO:825)5"-po3-門GAG門TTTT4.66(SEQIDNO:827)5,P03-TTAGCGGTT4.67(SEQIDNO:829)4.68(SEQIDNO:831)4.69(SEQIDNO:833)5rpo3-G門c:AGArTT4.70(SEQIDNO:835)5。-p03-GAGA門門nr4.71(SEQIDNO:837)4.72(SEQIDNO:839)4.734.744.754.764.774.784.794.80(SEQIDNO:818)^-po3-T門AGCCTT門(SEQIDNO:820)5-,p03-門GTTCTGTT門(SEQIDNO:822)5J-1P03-GG門A門T門,TC:(SEQIDNO:824)(SEQIDNO:826)5"-P03-AAGCTCGT.門(SEQIDNO:828)5廣po3-門0;G門叫AA叫門(SEQIDNO:830)5,-p03-CAAGAGGT門(SEQIDNO:832)5:P03-AGAGA門CT門(SEQIDNO:834)(SEQIDNO:836)2-po3-AGGT.門TCT門(SEQIDNO:838)5--P03-CTGTGTGT門(SEQIDNO:840)5Z力03-門C:T門TT門TT(SEQIDNO:841)y-p03-TTAGAG門GTT(SEQIDNO:843)(SEQIDNO:845)5。-p03-GG門TTTGTTT(SEQIDNO:847)y-p03-GA門G門GA,TT(SEQIDNO:849)5rp03-CGAGCTGrT(SEQIDNO:851)(SEQIDNO:853)5rp03-門A叫門門GTrT(SEQIDNO:855)5廣P03-GAAGAGGT門(SEQIDNO:842)(SEQIDNO:844)5"-p03-AAGG,TG門TT門(SEQIDNO:846)5rp03-A門AAG門門叫門(SEQIDNO:848)5"-p03-,T門GCG,T門T-門(SEQIDNO:850)5rpo3-門AGcr門GTT門(SEQIDNO:852)5::P03-GG門T.CTAT門(SEQIDNO:854)5rp03-A門GGATTG,T門(SEQIDNO:856)5'-P03-GGTCTCGTT5,-P03-CGAGACCTC4.81(SEQIDNO:857)(SEQIDNO:858)5'-P03-GCCAGAGTT5'-P03-CTCTGGCTC4.82(SEQIDNO:859)(SEQIDNO:860)5'-P03-GAGACCGTT5'-P03-CGGTCTCTC4.83(SEQIDNO:861)(SEQIDNO:862)5'-P03-CGAGCTATT5'-P03-TAGCTCGTC4.84(SEQIDNO:863)(SEQIDNO:864)5'-P03-GCAAGTGTT5'-P03-CACTTGCTC4.85(SEQIDNO:865)(SEQIDNO:866)5'-P03-GGTC丁CCTT5'-P03-GGAGACCTC4.86(SEQIDNO:867)(SEQIDNO:868)5'-P03-GCCAGACTT5'-P03-GTCTGGCTC4.87(SEQIDNO:869)(SEQIDNO:870)5'-P03-GGTCTCATT5,-P03-TGAGACCTC4.88(SEQIDNO:871)(SEQIDNO:872)5'-P03-GAGACCATT5,-P03-TGGTCTCTC4.89(SEQIDNO:873)(SEQIDNO:874)5'-P03-CCTTCAGTT5'-P03-CTGAAGGTC4.90(SEQIDNO:875)(SEQIDNO:876)5'-P03-GCACCTGTT5'-P03-CAGGTGCTC4.91(SEQIDNO:877)(SEQIDNO:878)5'-P03-AAAGGCGTT5'-P03-CGCCTTTTC4.92(SEQIDNO:879)(SEQIDNO細(xì))5,匿P03-CAGATCGTT5'-P03-CGATCTGTC4.93(SEQIDNO:881)(SEQIDNO:882)5,-P03-CATAGGCTT5'-P03-GCCTATGTC4.94(SEQIDNO:883)(SEQIDNO:884)5'-P03-CCTTCACTT5'-P03-GTGAAGGTC4.95(SEQIDNO:885)(SEQIDNO:886)5,-P03-GCACCTCTT5,-P03-GAGGTGCTC4.96(SEQIDNO:887)(SEQIDNO:888)表7:用于循環(huán)l-4的結(jié)構(gòu)單元和寡核苷酸標(biāo)簽之間的對應(yīng)關(guān)系結(jié)構(gòu)單元循環(huán)1循環(huán)2循環(huán)3循環(huán)4BB11.12.13.14.1BB21.22.23.24.2BB31.32.33.34.3BB41.42.43.44.4BB51.52.53.54.5BB61.62.63.64.6BB71.72.73.74.7BB81.82.83.84.8BB91.92.93.94.9BB101.102.103.104.10BB11.112.113.114.11BB12.122.123.124.12BB13U32.133.134.13BB141.142.143.144.14BB15U52.153.154.15BB161.162.163.〗64.16BB171.172.173.174.17BB181.182.183.184.18BB19U92.193.194.19BB201.202.203.204.20BB211.212.213.214.21BB221.222.223.224.22BB231.232.233.234.23BB241.242.243.244.24BB251.252.253.254.25BB261.262.263.264.26BB271.272.273.274.27BB281.282.283.284.28BB291.292.293.294.29BB301.302.303.304.30BB311.312.313.314.31BB32U22.323.324.32BB331.332.333.334.33BB341.342.343.344.34BB351.352.353.354.35BB361.362.363.364.36BB371.372.373.374.37BB381.382.383.384.38BB391.392.393.394.39BB401.442.443.444.44BB411.412.413.414.41BB421.422.423.424.42BB431.432.433.434.43BB441.402.403.404.40BB451.452.453.454.45BB461.462.463.464.46BB471.472.473.474.47BB481.482.483.484.48BB491.492.493.494.49BB501.502.503.504.50BB511.512.513.514.51BB521.522,523.524.52BB531.532.533.534.53BB541.542.543.544.54BB551.552.553.554.55BB561.562.563.564.56BB571.572.573.574.57BB581.582,583.584.58BB591.592.593.594.59BB601.602.603.604.60BB611.612.613.614.61BB621.622.623.624.62BB631.632.633.634.63BB641.642.643.644.64BB651.652.653.654.65BB661.662.663.664.66BB671.672.673,674.67BB681.682.683.684.68BB691.692.693.694.69BB701.702.703.704.70BB711.712.713.714.71BB721.722.723.724.72BB731.732.733.734.73BB741.742.743.744.74BB751.752.753,754.75BB761.762.763.764.76BB771.772.773.774.77BB781.782.783.784.78BB791.792.793.794.79BB801.802.803.804.80BB811.812.813.814.81BB821.822.823.824.82BB831.962.963.964.96BB841.832.833.834.83BB851.842.843,844.84BB861.852.853.854.85BB871.862.863.864.86BB881.872.873.874.87BB891.882.883.884.88BB901.892.893.894.89BB911.902.903.904.90BB921.912.913.914.91BB931.922.923.924.92BB941.932.933.934.93BB951.942.943.944.94BB961.952.953.954.95lx連接酶緩沖液50mMTris,pH7.5;10mM二硫蘇糖醇;10mMMgCl2;2mMATP;50mMNaCl。lOx連接酶緩沖液500mMTris,pH7.5;100mM二硫蘇糖醇;100mMMgCl2;20mMATP;500mMNaCl。水溶性間隔基與化合物2的連接向冷卻到4。C的化合物2在硼酸鈉緩沖液(150mM,pH9.4)中的溶液(60mL,1mM)中加入在N,N-二曱基甲酰胺(DMF)(16mL,0.15M)中的40當(dāng)量的N-Fmoc-15-氨基-4,7,10,13-四氧雜硬脂酸(S-Ado),接著加入40當(dāng)量的4-(4,6-二甲氧基[1.3.5]三。秦-2-基)-4-曱基嗎啉氯化物水合物(DMTMM)的水溶液(9.6mL,0.25M)?;旌衔镌?°C下輕輕振蕩2小時,之后加入40當(dāng)量的S-Ado和DMTMM,并在4°C下再振蕩16小時。酰化后,加入O.lx體積的5MNaCl水溶液和2.5x體積的冷(-20°C)乙醇,使該混合物在-20。C下靜置至少1小時。然后在4。C下以14,000rpm離心該混合物15分鐘,獲得白色沉淀物,用冷EtOH洗滌,然后在凍千機(jī)中室溫干燥30分鐘。將固體溶解在40mL水中,使用WatersXterraRP,s柱通過反相HPLC純化。使用50mM乙酸三乙銨緩沖液pH7.5和99%乙腈/1%水溶液,利用二元流動相梯度分布洗脫產(chǎn)物。通過凍干濃縮純化的物質(zhì),將獲得的殘余物溶解于5mL水中。向溶液中加入O.lx體積的哌啶,在室溫下輕輕振蕩混合物45分鐘。然后如上所述通過乙醇沉淀純化產(chǎn)物,并且離心分離。將獲得的沉淀物用冷EtOH洗滌兩次,通過凍干干燥,獲得純化的化合物3。循環(huán)1向96孔板的每個孔中加入12.5pL4mM化合物3的水溶液;100|uL如表3所示的寡核苷酸標(biāo)簽1.1至1.96之一的1mM溶液(化合物3與標(biāo)簽的摩爾比為1:2)。將板加熱至95。C1分鐘,然后冷卻至16°C10分鐘。向每孔中加入10|uL10x連接酶緩沖液、30單位T4DNA連接酶(1|LiL30單位/jLiL溶液(FermentasLifeScience,目錄號EL0013))、76.5pi水,獲得的溶液在16°C下溫育16小時。連接反應(yīng)后,向每孔中直接加入20iaL5MNaCl水溶液,然后加入500冷(-20。C)乙醇,在-20。C下保持1小時。在BeckmanCoulterAllegra6R離心機(jī)上,使用BeckmanMicroplusCarriers,以3200g將板離心1小時。通過將板倒置小心地除去上清液,用-20。C的70%冷乙醇水溶液洗滌沉淀物。然后將每種沉淀物溶解于硼酸鈉緩沖液(50150mM,pH9.4)中至濃度為1mM,并冷卻至4。C。向每種溶液中加入在DMF中的40當(dāng)量的96種結(jié)構(gòu)單元前體之一(13|uL,0.15M),然后加入40當(dāng)量的DMT-MM水溶液(8pL,0.25M),溶液在4°C下輕輕振蕩。2小時后,加入另外40當(dāng)量的各種結(jié)構(gòu)單元前體之一和DMTMM,溶液在4。C下輕輕振蕩16小時。?;?,向每種溶液中加入在DMF中的10當(dāng)量乙酸-N-羥基-琥珀酰亞胺酯(2|uL,0.25M),輕輕振蕩IO分鐘。酰化后,合并96個反應(yīng)混合物,加入0.1倍體積的5MNaCl水溶液和2.5倍體積的冷無水乙醇,使溶液在-20。C下靜置至少1小時。然后離心該混合物。離心后,用微量移液器除去盡可能多的上清液,用冷乙醇洗滌沉淀物,再次離心。用200iiL移液管除去上清液。向管中加入70%冷乙醇,獲得的混合物在4。C下離心5分鐘。棄去上清液,通過在室溫下凍干IO分鐘除去剩余的乙醇。然后將沉淀物溶解在2mL水中,并使用WatersXterraRPw柱通過反相HPLC純化。使用50mM乙酸三乙銨水緩沖液pH7.5和99%乙腈/1%水溶液,利用二元流動相梯度分布來洗脫文庫。收集、合并和凍干含有該文庫的級分。將獲得的殘余物溶解在2.5mL水中,加入250)LiL哌。定。輕輕振蕩溶液45分鐘,然后如前所述用乙醇沉淀。獲得的沉淀物通過凍干干燥,然后溶解在硼酸鈉緩沖液(4.8mL,150mM,pH9.4)中至濃度為1mM。將溶液冷卻至4。C,加入各40當(dāng)量的N-Fmoc-炔丙基甘氨酸的DMF溶液(L2mL,0.15M)和DMT-MM水溶液(7.7mL,0.25M)。混合物在4。C下輕輕振蕩2小時,之后加入另外40當(dāng)量的N-Fmoc-炔丙基甘氨酸和DMT-MM,溶液再4展蕩16小時。稍后如上所述通過EtOH沉淀和反相HPLC純化該混合物,并且如前所述用p底啶處理除去N-Fmoc基團(tuán)。在通過EtOH沉淀進(jìn)行最終純化后,凍干干燥獲得的沉淀物,并進(jìn)入合成的下一循環(huán)。循環(huán)2-4對于這些循環(huán)中的每一個,將來自前一循環(huán)的干燥沉淀物溶解在水中,并且根據(jù)文庫DNA成分的消光系數(shù),通過分光光度法測定文庫的濃度,其中化合物2的初始消光系數(shù)為131,500L/(mole.cm)。用水調(diào)節(jié)文庫的濃度,使后續(xù)連接反應(yīng)中的終濃度為0.25mM。然后將文庫在96簽的摩爾比為1:2),如循環(huán)1所述進(jìn)行連接。循環(huán)2、3、4中使用的寡核苷酸標(biāo)簽分別在表4、5、6中列出。對于循環(huán)1-4中的每一個,標(biāo)簽與結(jié)構(gòu)單元前體之間的對應(yīng)關(guān)系在表7中提供。如以上對于循環(huán)1所述,通過加入乙醇來沉淀文庫,并將其溶解在硼酸鈉緩沖液(150mM,pH9.4)中至濃度為1mM。隨后的酰化和純化如循環(huán)1所述進(jìn)行,不同之處在于循環(huán)3中省略了HPLC純化。利用以上所述的標(biāo)簽連接的方法,將循環(huán)4的產(chǎn)物與以下所示的封閉引物連接。5,-P03-CAGAAGACAGACAAGCTTCACCTGC(SEQIDNO:889)結(jié)果上述合成程序能夠產(chǎn)生含有964(約108)個不同結(jié)構(gòu)的文庫。通過對每一循環(huán)的產(chǎn)物進(jìn)行凝膠電泳和LC/MS,監(jiān)測文庫的合成。完成后,用幾種方法分析文庫。圖13A是循環(huán)4后,但在封閉引物連接前的文庫的層析圖;圖13B是同一合成階段的文庫的質(zhì)譜圖。平均分子量通過負(fù)離子LC/MS分析測定。離子信號用ProMass軟件解析。該結(jié)果與預(yù)測的該文庫的平均質(zhì)量一致。通過瓊脂糖凝膠電泳分析文庫的DNA成分,顯示文庫物質(zhì)中的大多數(shù)對應(yīng)于正確大小的連接產(chǎn)物。對從文庫采樣獲得的PCR產(chǎn)物的分子克隆進(jìn)行DNA序列分析,顯示DNA連接高保真度地發(fā)生,并且接近于完成。文庫環(huán)化在循環(huán)4結(jié)束時,在通常的?;瘲l件下,用疊氮基乙酸將文庫的一部分在N-末端加帽。將通過EtOH沉淀純化的產(chǎn)物溶解在磷酸鈉緩沖液(150mM,pH8)中至濃度為1mM,并加入各為4當(dāng)量的CuS04水溶液(200mM)、抗壞血酸水溶液(200mM)和以下所示化合物的DMF溶液(200mM)。反應(yīng)混合物然后在室溫下輕輕振蕩2小時。為了測定環(huán)化程度,從文庫環(huán)化反應(yīng)體系中取出5pL等份,用如實(shí)施例4所述制備的焚光標(biāo)記的疊氮化物或炔(lfaL100mMDMF貯存液)處理。16小時后,才艮據(jù)500nm下的HPLC分析,炔或疊氮化物標(biāo)記都未摻入文庫中。該結(jié)果表示該文庫不再含有能夠環(huán)加成的疊氮基或炔前所述通過反相HPLC純化環(huán)化的文庫。用未環(huán)化的文庫進(jìn)行的對照實(shí)驗(yàn)顯示上述熒光標(biāo)記完全摻入。實(shí)施例4:用于環(huán)化測定的熒光標(biāo)記的制備在單獨(dú)的管中,炔丙基甘氨酸或2-氨基-3-苯丙基疊氮(各8pmol)與FAM-OSu(MolecularProbesInc.)(1.2當(dāng)量)在pH9.4的硼酸鹽緩沖液基,因此該文庫(250iiL)中混合。反應(yīng)在室溫下進(jìn)行3小時,然后凍干過夜。經(jīng)HPLC純化以定量產(chǎn)率獲得需要的焚光炔和疊氮化物。<formula>formulaseeoriginaldocumentpage108</formula>實(shí)施例5:利用疊氮/炔環(huán)加成反應(yīng)環(huán)化各化合物疊氮基乙酰基-Gly-Pro-Phe-Pra-NH2的制備利用0.3mmolRink-酰胺樹脂,以Fmoc-保護(hù)的氨基酸和HATU為活化劑,用標(biāo)準(zhǔn)固相合成技術(shù)合成指定的序列(Pra=C-炔丙基甘氨酸)。使用疊氮基乙酸對該四肽加帽。用20。/oTFA/DCM從樹脂上切割肽4小時。經(jīng)RPHPLC純化獲得為白色固體的產(chǎn)物(75mg,51%)。!HNMR(DMSO-d6,400MHz):8.4-7.8(m,3H),7.4-7.1(m,7H),4.6-4,4(m,1H),4.4-4.2(m,2H),4.0-3.9(m,2H),3.74(dd,1H,J=6Hz,17Hz),3.5-3.3(m,2H),3.07(dt,1H,J=5Hz,14Hz),2.92(dd,1H,J=5Hz,16Hz),2,86(t,1H,J=2Hz),2.85-2.75(m,1H),2.6-2.4(m,2H),2.2-1.6(m,4H)。IR(mull)2900,2100,1450,1300cm—1。ESIMS497.4([M+H],100%),993,4([2M+H],50%)。離子源破碎的ESIMS:519.3([M+Na],100%),491.3(100%),480.1([M-NH2],90%),452.2([M-NH2-CO],20%),424.2(20%),385.1([M-Pra],50%),357.1([M-Pra-CO〗,40%),238.0([M-Pra-Phe],100%)。疊氮基乙?;?Gly-Pro-Phe-Pra-NH2的環(huán)化疊氮基乙?;?31mg,0.62mmol)溶解在MeCN(30mL)中。加入二異丙基乙胺(D正A,1mL)和Cu(MeCN)4PF6(1mg)。攪拌1.5小時后,蒸發(fā)該溶液,將獲得的殘余物回收在20%MeCN/H20中。離心除去不溶性鹽后,對溶液進(jìn)行制備型反相HPLC。分離需要的環(huán)肽,其為白色固體(10mg,32%)。iHNMR(DMSO畫d6,400MHz):8.28(t,1H,J=5Hz),7.77(s,1H),7.2-6.9(m,9H),4.98(m,2H),4.48(m,1H),4.28(m,1H),4.1—3.9(m,2H),3.63(dd,1H,J=5Hz,16Hz),3.33(m,2H),3.0(m,3H),2.48(dd,1H,J=11Hz,14Hz),1.75(m,1H0,1.55(m,1H),1.32(m,1H),1.05(m,1H)。IR(mull)2900,1475,1400cm人ESIMS497.2([M+H],100%),993.2([2M+H],30%),1015.2([2M+Na],15%)。離子源破碎的ESIMS:535.2(70%),519.3([M+Na],100%),497.2([M+H],80%),480.1([M-NH2],30%),452.2([M-NH2-CO],40%),208.1(60%)。疊氮基乙?;?Gly-Pro-Phe-Pm-Gly-OH的制備利用0.3mmol甘氨酸-Wang樹脂,以Fmoc-保護(hù)的氨基酸和HATU為活化劑,合成指定的序列。在最后的偶聯(lián)步驟中使用疊氮基乙酸對該五肽加帽。用50%TFA/DCM切割該肽2小時。經(jīng)RPHPLC純化獲得為白色固體的肽(83mg;50%)。!HNMR(DMSO-d6,400MHz):8.4一7.9(m,4H),7.2(m,5H),4.7-4,2(m,3H),4.0-3.7(m,4H),3.5-3.3(m,2H),3.1(m,1H),2.91(dd,1H,J=4Hz,16Hz),2.84(t,lH,J=2.5Hz),2.78(m,1H),2.6—2.4(m,2H),2.2—1.6(m,4H)。IR(mull)2900,2100,1450,1350cm"。ESIMS555.3([M+H],100%)。離子源破碎的ESIMS:577.1([M+Na],90%),555.3([M+H],80%),480.1([M畫Gly〗,100%),385.1([M畫Gly-Pra],70%),357.1([M-Gly畫Pra-CO],40%),238.0([M-Gly-Pra-Phe],80%)。疊氮基乙酰基-Gly-Pro-Phe-Pra-Gly-OH的環(huán)化將肽(32mg,0.058mmol)溶解于MeCN(60mL)中。加入二異丙基乙胺(1mL)和Cu(MeCN)4PF6(1mg),攪拌該溶液2小時。蒸發(fā)溶劑,對粗產(chǎn)物進(jìn)行RPHPLC以除去二聚體和三聚體。分離環(huán)狀單體,其為無色玻璃狀物(6mg,20%)。ESIMS555.6([M+H],100%),1109.3([2M+H],20%),1131.2([2M+Na],15%)。離子源破碎的ESIMS:555.3([M+H],100%),480.4([M-Gly],30%),452.2([M-Gly畫CO],25%),424.5([M-Gly-2CO],10%,只在環(huán)形結(jié)構(gòu)中才有可能)。直鏈肽與DNA的偶聯(lián)化合物2(45nmol)溶解在45pL硼酸鈉緩沖液(pH9.4;150mM)中。在4。C下加入直鏈肽(18pL在DMF中的100mM貯存液;180nmol;40當(dāng)量),然后加入DMT-MM(3.6|iL500mM在水中的貯存液;180nmol;40當(dāng)量)。攪拌2小時后,LCMS顯示完全反應(yīng),經(jīng)乙醇沉淀分離產(chǎn)物。ESIMS1823,0([M-3H]/3,20%),1367.2([M-4H]/4,20%),1093.7([M-5H]/5,40%),911.4([M-6H]/6,100%)。環(huán)肽與DNA的偶聯(lián)化合物2(20nmol)溶解在20硼酸鈉緩沖液(pH9.4,150mM)中。在4。C下加入直鏈肽(8100mM在DMF中的貯存液;80nmol;40當(dāng)量),然后加入DMT-MM(1.6pL500mM在水中的貯存液;80nmol;40當(dāng)量)。攪拌2小時后,LCMS顯示完全反應(yīng),經(jīng)乙醇沉淀分離產(chǎn)物。ESIMS1823.0([M匿3H]/3,20%),1367.2([M-4H]/4,20%),1093.7([M-5H]/5,40%),911.4([M-6H]/6,100%)。DNA-連接的肽的環(huán)化直鏈肽-DNA偶聯(lián)物(lOnmol)溶解在pH8的磷酸鈉緩沖液(IOpL,150mm)中。在室溫下加入各為4當(dāng)量的CuS04、抗壞血酸和Sharpless配體(0.2pL200mM貯存液)。反應(yīng)進(jìn)行過夜。RPHPLC顯示沒有直鏈肽-DNA,產(chǎn)物與標(biāo)準(zhǔn)環(huán)肽-DNA共洗脫。未見痕量二聚體或其他寡聚體。LC條件:TargaC18,2.1x40mm,10-40%MeCN在40mMTEAA水溶液中,8分鐘實(shí)施例6:芳香親核取代反應(yīng)應(yīng)用于功能部分的合成用氰尿酰氯對化合物3進(jìn)行芳基化的一般程序化合物2以1mM的濃度溶解在pH9.4的硼酸鈉緩沖液中。將溶液冷卻至4。C,然后加入20當(dāng)量的氰尿酰氯,作為在MeCN中的500mM溶液。2小時后,經(jīng)LCMS證實(shí)反應(yīng)完全,獲得的二氯三溱-DNA偶聯(lián)物經(jīng)乙醇沉淀分離。二氯三。秦-DNA的胺耳又代程序二氯三。秦-DNA偶if關(guān)物以1mM的濃度溶解在pH9.5硼酸鹽緩沖液中。在室溫下作為DMF溶液加入40當(dāng)量的脂肪族胺。該反應(yīng)后進(jìn)行LCMS,通常在2小時后完成。獲得的烷基氨基-一氯三。秦-DNA偶聯(lián)物經(jīng)乙醇沉淀分離。一氯三。秦-DNA的胺耳又代程序烷基氨基-一氯三嗪-DNA偶聯(lián)物以1mM的濃度溶解在pH9.5硼酸鹽緩沖液中。在42。C下作為DMF溶液加入40當(dāng)量的第二種脂肪族胺。該反應(yīng)后進(jìn)行LCMS,通常在2小時后完成。獲得的二氨基三嗪-DNA偶聯(lián)物經(jīng)乙醇沉淀分離。實(shí)施例7:還原性胺化反應(yīng)應(yīng)用于功能部分的合成含仲胺的DNA-連接體與醛結(jié)構(gòu)單元的還原性胺化的一般程序化合物2與N-末端脯氨酸殘基偶聯(lián)。獲得的化合物以1mM的濃度溶解在^5舞酸鈉緩沖液(50|LiL,150mM,pH5.5)中。向該溶液中加入各為40當(dāng)量的DMF中的醛結(jié)構(gòu)單元(8pL,0.25M)和DMF中的氰基硼氫化鈉(8^L,0.25M),將溶液在80。C下加熱2小時。烷基化后,通過乙醇沉淀純〗t該溶液。含醛的DNA-連接體與胺結(jié)構(gòu)單元的還原性胺化的一般程序與含醛基的結(jié)構(gòu)單元偶聯(lián)的化合物2以1mM的濃度溶解在磷酸鈉緩沖液(50nL,250mM,pH5.5)中。向該溶液中加入各為40當(dāng)量的DMF中的胺結(jié)構(gòu)單元(8pL,0.25M)和DMF中的氰基硼氫化鈉(8pL,0.25M),將溶液在80。C下加熱2小時。烷基化后,通過乙醇沉淀純化該溶液。實(shí)施例8:類肽構(gòu)建反應(yīng)應(yīng)用于功能部分的合成在DNA-連接體上進(jìn)行類肽合成的一般程序o、o,B"0R、nH2N,、DNA-連接體-B^^^N^DNAr連接體-HN^^fT、DNA-連接體40當(dāng)量H40當(dāng)量H化合物2以1mM的濃度溶解在硼酸鈉緩沖液(50pL,150mM,pH9.4)中,冷卻到4。C。向該溶液中加入40當(dāng)量的DMF中的N-羥基琥珀酰亞氨基溴乙酸酯(13^L,0.15M),該溶液在4。C下輕輕振蕩2小時。?;?,DNA-連接體經(jīng)乙醇沉淀純化,以1mM的濃度再溶解在硼酸鈉緩沖液(50150mM,pH9.4)中,并冷卻到4。C。向該溶液中加入40當(dāng)量的DMF中的胺結(jié)構(gòu)單元(13^L,0.15M),溶液在4°C下輕輕振蕩16小時。烷化后,DNA-連接體經(jīng)乙醇沉淀純化,以lmM的濃度再溶解在硼酸鈉緩沖液(50150mM,pH9.4)中,并冷卻到4。C。通過分步加入N-羥基琥珀酰亞氨基溴乙酸酯,接著加入胺結(jié)構(gòu)單元,繼續(xù)類肽合成。實(shí)施例9:疊氮化物-炔環(huán)加成反應(yīng)應(yīng)用于功能部分合成一般程序含炔的DNA偶聯(lián)物以約1mM的濃度溶解在pH8.0的磷酸鹽緩沖液中。在室溫下向該混合物中加入10當(dāng)量的有機(jī)疊氮化物和各為5當(dāng)量的硫酸銅(n)、抗壞血酸和配體(三-((i-千基三唑-4-基)曱基)胺)。該反應(yīng)后進(jìn)行LCMS,通常在l-2小時后完成。獲得的三唑-DNA偶聯(lián)物可通過乙醇沉淀分離。實(shí)施例10:從編碼文庫內(nèi)鑒定Abl激酶的配體為了鑒定對治療目標(biāo)具有確定性質(zhì)的單一化合物,在DNA-編碼文庫中相對于不需要的文庫成員富集目標(biāo)分子的能力是極為重要的。為了證明這種富集能力,合成了rhAbl激酶(GenBankU07563)的已知結(jié)合分子(描述于Shah等人,Sde"ce305,3"-401(2004),在此引用作為參考)。利用標(biāo)準(zhǔn)化學(xué)方法將該化合物通過前面實(shí)施例中所述的連接體連接到雙鏈DNA寡核苷酸上,產(chǎn)生與通過實(shí)施例1和2所述方法產(chǎn)生的產(chǎn)物(與寡核苷酸連接的功能部分)相類似的分子。通常如實(shí)施例2所述產(chǎn)生的文庫和DNA-連接的Abl激酶結(jié)合分子設(shè)計為具有獨(dú)特的DNA序列,使兩種物質(zhì)都能進(jìn)行qPCR分析。DNA-連接的Abl激酶結(jié)合分子與文庫以1:1000的比例混合。該混合物用rhAble激酶平衡,該酶在固相上捕獲,洗滌除去未結(jié)合的文庫成員,洗脫結(jié)合的分子。洗脫物中文庫分子與DNA-連接的Abl激酶抑制劑的比例為1:1,表示DNA-連接的Abl-激酶結(jié)合分子獲得500倍以上的富集,與文庫分子相比1000-倍過量。等同方案本領(lǐng)域技術(shù)人員應(yīng)當(dāng)認(rèn)識到,或者僅應(yīng)用常規(guī)實(shí)驗(yàn)就能夠確定本文所述的本發(fā)明的特定實(shí)施方案的許多等同方案。這些等同方案包括在權(quán)利要求書的范圍之內(nèi)。權(quán)利要求1.一種合成包含與編碼寡核苷酸有效連接的功能部分的分子的方法,該方法包括以下步驟(a)提供由包含n個結(jié)構(gòu)單元的起始功能部分組成的起始化合物,其中n是1或大于1的整數(shù),其中該起始功能部分包含至少一個反應(yīng)基團(tuán),并且與起始寡核苷酸有效連接;(b)將該起始化合物與包含至少一個互補(bǔ)反應(yīng)基團(tuán)的結(jié)構(gòu)單元反應(yīng),其中該至少一個互補(bǔ)反應(yīng)基團(tuán)與步驟(a)的反應(yīng)基團(tuán)互補(bǔ),反應(yīng)條件適合所述互補(bǔ)反應(yīng)基團(tuán)反應(yīng)形成共價鍵;(c)將所述起始寡核苷酸與標(biāo)識步驟(b)的結(jié)構(gòu)單元的引入寡核苷酸反應(yīng),反應(yīng)條件適合所述引入寡核苷酸與起始寡核苷酸連接形成編碼寡核苷酸,并存在催化起始寡核苷酸與引入寡核苷酸連接的酶;從而產(chǎn)生包含功能部分的分子,該功能部分含有n+1個結(jié)構(gòu)單元,并且與編碼寡核苷酸有效連接。2.權(quán)利要求l的方法,其中步驟(c)的功能部分包含反應(yīng)基團(tuán),重復(fù)步驟(a)至(c)一次或多次,從而形成循環(huán)l至i,其中i是2或大于2的整數(shù),其中循環(huán)s的步驟(c)的產(chǎn)物是循環(huán)s+1的起始化合物,其中s是i-l或更小的整數(shù)。3.權(quán)利要求l的方法,其中步驟(c)在步驟(b)之前,或者步驟(b)在步驟(c)之前。4.權(quán)利要求l的方法,其中所述結(jié)構(gòu)單元的至少一個是氨基酸或活化的氨基酸。5.權(quán)利要求l的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自氨基、羧基、磺酰基、膦?;h(huán)氧基、吖丙啶基和異氰酸酯基。6.權(quán)利要求l的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自羥基、羧基、磺酰基、膦酰基、環(huán)氧基、吖丙啶基和異氰酸酯基。7.權(quán)利要求l的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自氨基和醛基或酮基。8,權(quán)利要求7的方法,其中所述反應(yīng)基團(tuán)與互補(bǔ)反應(yīng)基團(tuán)之間的反應(yīng)在還原條件下進(jìn)行。9.權(quán)利要求l的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自磷葉立德基和醛基或酮基。10.權(quán)利要求l的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)通過環(huán)加成作用反應(yīng),形成環(huán)結(jié)構(gòu)。11.權(quán)利要求10的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自炔和疊氮基。12.權(quán)利要求10的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自閨代雜芳基和親核基團(tuán)。13.權(quán)利要求12的方法,其中所述囟代雜芳基選自氯代嘧啶、氯代三。秦和氯代嘌呤。14.權(quán)利要求12的方法,其中所述親核基團(tuán)是氨基。15.權(quán)利要求1的方法,其中所述酶選自DNA連接酶、RNA連接酶、DNA聚合酶、RNA聚合酶和拓樸異構(gòu)酶。16.權(quán)利要求l的方法,其中所述起始寡核苷酸是雙鏈或單鏈的。17.權(quán)利要求16的方法,其中所述起始寡核苷酸包含PCR引物序列。18.權(quán)利要求16的方法,其中所述起始寡核苷酸是單鏈的,且引入寡核苷酸是單鏈的;或者起始寡核苷酸是雙鏈的,且引入寡核苷酸是雙鏈的。19,權(quán)利要求18的方法,其中起始功能部分和起始寡核苷酸通過連接部分連接。20.權(quán)利要求19的方法,其中所述起始寡核苷酸是雙鏈的,所述連接部分與起始功能部分和與起始寡核苷酸的兩條鏈共價偶聯(lián)。21.權(quán)利要求l的方法,其中所述引入寡核苷酸的長度為3到10個核普酸。22.權(quán)利要求2的方法,其中循環(huán)i的引入寡核苷酸包含PCR封閉引物。23.權(quán)利要求2的方法,其在循環(huán)i中進(jìn)一步包括以下步驟(d)將包含封閉PCR引物序列的寡核苷酸與編碼寡核香酸連接。24.權(quán)利要求23的方法,其中在催化所述連接的酶的存在下,將包含封閉PCR引物序列的寡核苷酸與編碼寡核苷酸連接。25.權(quán)利要求2的方法,其在循環(huán)i后進(jìn)一步包括以下步驟(e)環(huán)化所述功能部分。26.權(quán)利要求25的方法,其中所述功能部分包含炔基和疊氮基,且將該化合物在適合炔基和疊氮基環(huán)加成作用形成三唑基的條件下處理,從而環(huán)化該功能部分。27.—種合成化合物文庫的方法,其中所述化合物包含功能部分,該功能部分包含兩個或多個結(jié)構(gòu)單元并且與標(biāo)識該功能部分結(jié)構(gòu)的起始寡核苷酸有效連接,該方法包括下列步驟(a)提供包含m種起始化合物的溶液,其中m是1或大于1的整數(shù),其中起始化合物由包含n個結(jié)構(gòu)單元的功能部分組成,其中n是l或大于1的整數(shù),該功能部分與標(biāo)識該n個結(jié)構(gòu)單元的起始寡核苷酸有效連接;(b)將步驟(a)的溶液分配到r個反應(yīng)容器中,其中r是2或大于2的整數(shù),從而產(chǎn)生r個等份的溶液;(c)將每個反應(yīng)容器中的起始化合物與r個結(jié)構(gòu)單元之一反應(yīng),從而產(chǎn)生r個等份,該等份包含由功能部分組成的化合物,該功能部分包含n+l個結(jié)構(gòu)單元,并且與起始寡核苷酸有效連接;和(d)在適合引入寡核普酸與起始寡核苷酸發(fā)生酶連接的條件下,在催化引入寡核苦酸與起始寡核苷酸連接的酶的存在下,將每個等份中的起始寡核苷酸與一組r個不同引入寡核苷酸之一反應(yīng);從而產(chǎn)生r個等份,這些等份包含由功能部分組成的分子,該功能部分包含n+l個結(jié)構(gòu)單元,并且與編碼該n+l個結(jié)構(gòu)單元的延長的寡核苷酸有效連接。28.權(quán)利要求27的方法,其進(jìn)一步包括以下步驟(e)組合所述r個等份中的兩個或多個等份,從而產(chǎn)生包含多個由功能部分組成的分子的溶液,該功能部分包含11+1個結(jié)構(gòu)單元,并且與編碼該n+l個結(jié)構(gòu)單元的延長的寡核苷酸有效連接。29.權(quán)利要求28的方法,其中混合r個等份。30.權(quán)利要求28的方法,其中步驟(a)至(e)進(jìn)行一次或多次,產(chǎn)生循環(huán)l至i,其中i是2或大于2的整數(shù),其中在循環(huán)s+l中,其中s是i-l或更小的整數(shù),步驟(a)的含m種起始化合物的溶液是循環(huán)s的步驟(e)的溶液。31.權(quán)利要求7或權(quán)利要求8的方法,其中在循環(huán)l至i的至少一個中,步驟(d)在步驟(c)之前。32.權(quán)利要求28的方法,其中至少一個結(jié)構(gòu)單元是氨基酸。33.權(quán)利要求7的方法,其中所述酶是DNA連接酶、RNA連接酶、DNA聚合酶、RNA聚合酶或拓樸異構(gòu)酶。34.權(quán)利要求28的方法,其中所述起始寡核苷酸是雙鏈寡核苷酸。35.權(quán)利要求34的方法,其中所述引入寡核苷酸是雙鏈寡核苷酸。36.權(quán)利要求28的方法,其中所述起始化合物包含連接體部分,該連接體部分包含適合與結(jié)構(gòu)單元鍵合的第一官能團(tuán)、適合與寡核苷酸的5,末端鍵合的第二官能團(tuán),和適合與寡核苷酸的3,末端鍵合的第三官能團(tuán)。37.權(quán)利要求36的方法,其中所述連接體部分具有結(jié)構(gòu)B其中A是適合與結(jié)構(gòu)單元^t合的官能團(tuán);B是適合與寡核苷酸的5'末端鍵合的官能團(tuán);38.C是適合與寡核苦酸的3'末端鍵合的官能團(tuán);S是原子或支架;D是將A與S相連接的化學(xué)結(jié)構(gòu);E是將B與S相連接的化學(xué)結(jié)構(gòu);且F是將C與S相連接的化學(xué)結(jié)構(gòu)。38,權(quán)利要求37的方法,其中A是氨基;B是磷酸基;且C是磷酸基。39.權(quán)利要求37的方法,其中D、E和F各自獨(dú)立地為亞烷基或低聚(乙二醇)基。40.權(quán)利要求37的方法,其中S是碳原子、氮原子、磷原子、硼原子、磷酸基、環(huán)基或多環(huán)基。41.權(quán)利要求40的方法,其中連接體部分具有結(jié)構(gòu)其中n、m和p各自獨(dú)立地為1至約20的整^L42.權(quán)利要求41的方法,其中n、m和p各自獨(dú)立地為2至8的整數(shù)。43.權(quán)利要求42的方法,其中n、m和p各自獨(dú)立地為3至6的整數(shù)。44.權(quán)利要求41的方法,其中連接體部分具有結(jié)構(gòu)45.權(quán)利要求27的方法,其中所述起始化合物中的每一個都包含反應(yīng)基團(tuán),并且其中所述r個結(jié)構(gòu)單元中的每一個都包含與所述反應(yīng)基團(tuán)互補(bǔ)的互補(bǔ)反應(yīng)基團(tuán)。46.權(quán)利要求45的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自氨基、羧基、磺?;?、膦?;h(huán)氧基、吖丙啶基和異氰酸酯基。47.權(quán)利要求45的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自羥基、羧基、磺?;?、膦酰基、環(huán)氧基、吖丙啶基團(tuán)和異氰酸酯基。48.權(quán)利要求45的方法,其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自氨基和醛基或酮基。49.權(quán)利要求45的方法,的反應(yīng)在還原條件下進(jìn)行。50.4又利要求45的方法,磷葉立德基和醛基或酮基。51.權(quán)利要求45的方法,環(huán)加成作用反應(yīng),形成環(huán)結(jié)構(gòu)52.權(quán)利要求51的方法,炔和疊氮基。53.;〖又利要求45的方法,代雜芳基和親核基團(tuán)。54.權(quán)利要求53的方法,代三。秦和氯代噤呤。55.權(quán)利要求53的方法,其中所述親核基團(tuán)是氨基。其中所述反應(yīng)基團(tuán)與互補(bǔ)反應(yīng)基團(tuán)之間其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)通過其中所述反應(yīng)基團(tuán)和互補(bǔ)反應(yīng)基團(tuán)選自其中所述反應(yīng)基團(tuán)和互補(bǔ)官能團(tuán)選自卣其中所述囟代雜芳基選自氯代嘧啶、氯56.權(quán)利要求28的方法,其在循環(huán)i后進(jìn)一步包括以下步驟(f)環(huán)化一個或多個功能部分。57.權(quán)利要求56的方法,其中步驟(f)的功能部分包含疊氮基和炔基'58.權(quán)利要求57的方法,其中所述功能部分保持在適合疊氮基和炔基環(huán)加成反應(yīng)形成三唑基的條件下,從而形成環(huán)狀功能部分。59.權(quán)利要求58的方法,其中所述環(huán)加成反應(yīng)在銅催化劑的存在60.權(quán)利要求59的方法,其中步驟(f)的一個或多個功能部分中的至少一個包含至少兩個巰基,并且該功能部分保持在適合兩個巰基反應(yīng)形成二硫基的條件下,從而環(huán)化該功能部分。61.權(quán)利要求27的方法,其中所述起始寡核苷酸包含PCR引物序列。62.權(quán)利要求28的方法,其中循環(huán)i的引入寡核苷酸包含PCR封閉引物。63.權(quán)利要求28的方法,其在循環(huán)i后進(jìn)一步包括以下步驟(d)將包含封閉PCR引物序列的寡核苷酸與編碼寡核苷酸連接。64.權(quán)利要求63的方法,其中在催化所述連接的酶的存在下,所述包含封閉PCR引物序列的寡核苷酸與編碼寡核苷酸連接。65.下式的化合物I其中X是包含一個或多個結(jié)構(gòu)單元的功能部分;Z是在其3'末端與B連接的寡核苷酸;Y是在其5'末端與C連接的寡核苷酸;A是與X形成共價鍵的官能團(tuán);B是與Z的3,-末端形成鍵的官能團(tuán);C是與Y的5,-末端形成鍵的官能團(tuán);D、F和E各自獨(dú)立地是雙功能連接基團(tuán);且S是原子或分子支架。66.權(quán)利要求65的化合物,其中D、E和F各自獨(dú)立地是亞烷基鏈或低聚(乙二醇)鏈。67.權(quán)利要求65的化合物,其中Y和Z基本互補(bǔ),并且在化合物中定向,從而在適當(dāng)條件下能夠發(fā)生Watson-Crick堿基配對和雙鏈體形68.權(quán)利要求65的化合物,其中Y和Z具有相同的長度或不同的長度。69.權(quán)利要求68的化合物,其中Y和Z具有相同的長度。70.權(quán)利要求65的化合物,其中Y和Z的長度各為10個或更多石咸基,并且具有IO個或更多堿基對的互補(bǔ)區(qū)。71.權(quán)利要求65的化合物,其中S是碳原子、硼原子、氮原子、磷原子或多原子支架。72.權(quán)利要求71的化合物,其中S是磷酸基或環(huán)基。73.權(quán)利要求72的化合物,其中S是環(huán)烷基、環(huán)烯基、雜環(huán)烷基、雜環(huán)烯基、芳基或雜芳基。74.權(quán)利要求65的化合物,其中連接體部分具有結(jié)構(gòu)其中n、m和p各自獨(dú)立地為1至約20的整數(shù)。75.權(quán)利要求74的化合物,其中n、m和p各自獨(dú)立地為2至8的整數(shù)。76.權(quán)利要求75的化合物,其中n、m和p各自獨(dú)立地為3至6的整數(shù)。77.權(quán)利要求65的化合物,其中連接體部分具有結(jié)構(gòu)<formula>formulaseeoriginaldocumentpage10</formula>78.權(quán)利要求65的化合物,其中X和Y包含PCR引物序列。79.—種包含至少約102種不同化合物的化合物文庫,所述化合物包含功能部分,該功能部分包含兩個或多個結(jié)構(gòu)單元并且與標(biāo)識該功能部分的結(jié)構(gòu)的寡核苷酸有效連接。80.權(quán)利要求79的化合物文庫,該文庫包含各為至少約105個拷貝的不同化合物。81.權(quán)利要求79的化合物文庫,該文庫包含各為至少約106個拷貝的不同化合物。82.權(quán)利要求79的化合物文庫,其包含至少約104種不同的化合物。83.權(quán)利要求79的化合物文庫,其包含至少約106種不同的化合物。84.85.權(quán)利要求79的化合物文庫,其包含至少約10"種不同的化合86.權(quán)利要求79的化合物文庫,其包含至少約1012種不同的化合物。87.權(quán)利要求79的化合物文庫,其中該文庫包含多種獨(dú)立地為式I的化合物<formula>formulaseeoriginaldocumentpage10</formula>其中X是包含一個或多個結(jié)構(gòu)單元的功能部分;Z是在其3'末端與B連接的寡核苷酸;Y是在其5'末端與C連接的寡核苷酸;A是與X形成共價鍵的官能團(tuán);B是與Z的3,-末端形成鍵的官能團(tuán);C是與Y的5'-末端形成鍵的官能團(tuán);D、F和E各自獨(dú)立地是雙功能連接基團(tuán);且S是原子或分子支架。88.權(quán)利要求87的化合物文庫,其中對于每一種式I的化合物,A、B、C、D、E、F和S各自具有相同的身份。89.權(quán)利要求87的化合物文庫,該文庫基本由多種式I的化合物組成。90.權(quán)利要求87的化合物文庫,其中D、E和F各自獨(dú)立地是亞烷基鏈或低聚(乙二醇)鏈。91.權(quán)利要求87的化合物文庫,其中Y和Z基本互補(bǔ),并且在化合物中定向,從而在適當(dāng)條件下能夠發(fā)生Watson-Crick堿基配對和雙鏈體形成。92.權(quán)利要求87的化合物文庫,其中Y和Z具有相同的長度或不同的長度。93.權(quán)利要求87的化合物文庫,其中Y和Z具有相同的長度。94.權(quán)利要求87的化合物文庫,其中Y和Z的長度各自為10個或更多堿基,并且具有IO個或更多堿基對的互補(bǔ)區(qū)。95.權(quán)利要求87的化合物文庫,其中S是碳原子、硼原子、氮原子、磷原子或多原子支架。96.權(quán)利要求87的化合物文庫,其中S是磷酸基或環(huán)基。97.權(quán)利要求96的化合物文庫,其中S是環(huán)烷基、環(huán)烯基、雜環(huán)烷基、雜環(huán)烯基、芳基或雜芳基。98.權(quán)利要求87的化合物文庫,其中連接體部分具有結(jié)構(gòu)<formula>formulaseeoriginaldocumentpage12</formula>其中n、m和p各自獨(dú)立地是1至約20的整數(shù)。99.權(quán)利要求98的化合物文庫,其中n、m和p各自獨(dú)立地是2至8的整數(shù)。100.4又利要求99的化合物,其中n、m和p各自獨(dú)立地是3至6的整數(shù)。101.權(quán)利要求87的化合物,其中連接體部分具有結(jié)構(gòu)102.權(quán)利要求87的化合物文庫,其中X和Z包含PCR引物序列。103.由權(quán)利要求1的方法制備的一種化合物。104.由權(quán)利要求27的方法制備的一種化合物文庫。105.—種鑒定能與生物靶標(biāo)結(jié)合的一種或多種化合物的方法,該方法包括以下步驟(a)在適合化合物文庫的至少一個成員與靶標(biāo)結(jié)合的條件下,使該生物耙標(biāo)接觸通過權(quán)利要求27的方法制備的化合物文庫;(b)除去不與該靶標(biāo)結(jié)合的文庫成員;(c)擴(kuò)增能與該靶標(biāo)結(jié)合的化合物文庫至少一個成員的編碼寡核苷酸;(d)對步驟(c)的編碼寡核苷酸進(jìn)行測序;和(e)利用步驟(d)測定的序列確定能與該生物靶標(biāo)結(jié)合的化合物文庫成員的功能部分的結(jié)構(gòu);從而鑒定能與生物耙標(biāo)結(jié)合的一種或多種化合物。106.—種鑒定能與生物靶標(biāo)結(jié)合的化合物的方法,該方法包括以下步驟(a)在適合化合物文庫的至少一個成員與靶標(biāo)結(jié)合的條件下,使生物耙標(biāo)接觸包含至少約102種不同化合物的化合物文庫,該化合物包含功能部分,該功能部分包含兩個或多個結(jié)構(gòu)單元,并且與標(biāo)識該功能部分的結(jié)構(gòu)的寡核苷酸有效連接;(b)除去不與該靶標(biāo)結(jié)合的文庫成員;(c)擴(kuò)增能與該靶標(biāo)結(jié)合的化合物文庫至少一個成員的編碼寡核苷酸;(d)對步驟(c)的編碼寡核苷酸進(jìn)行測序;和(e)利用步驟(d)測定的序列確定能與該生物靶標(biāo)結(jié)合的化合物文庫成員的功能部分的結(jié)構(gòu);從而鑒定能與該生物靶標(biāo)結(jié)合的一種或多種化合物。107,權(quán)利要求106的方法,其中所述文庫包含各為至少約105個拷貝的不同化合物。108.權(quán)利要求106的方法,其中所述文庫包含各為至少約106個拷貝的不同化合物。109.權(quán)利要求106的方法,其中所述文庫包含至少約104種不同的化合物。110.權(quán)利要求106的方法,其中所述文庫包含至少約106種不同的化合物。111.權(quán)利要求106的方法,其中所述文庫包含至少約108種不同的化合物。112.權(quán)利要求106的方法,其中所述文庫包含至少約101()種不同的化合物。113.權(quán)利要求106的方法,其中所述化合物文庫包含至少約10'2種不同的化合物。114.權(quán)利要求106的方法,其中所述化合物文庫包含多種獨(dú)立地為式I的化合物FY。E(I)其中X是包含一個或多個結(jié)構(gòu)單元的功能部分;Z是在其3'末端與B連接的寡核苷酸;Y是在其5'末端與C連接的寡核苷酸;A是與X形成共價鍵的官能團(tuán);B是與Z的3,-末端形成鍵的官能團(tuán);C是與Y的5'-末端形成鍵的官能團(tuán);D、F和E各自獨(dú)立地是雙功能連接基團(tuán);且S是原子或分子支架。115.權(quán)利要求114的方法,其中對于每一種式I的化合物,A、B、C、D、E、F和S各自具有相同的身份。116.權(quán)利要求114的方法,其中所述化合物文庫基本由多種式I的化合物組成。117.權(quán)利要求114的方法,其中D、E和F各自獨(dú)立地是亞烷基鏈或低聚(乙二醇)鏈。118.權(quán)利要求114的方法,其中Y和Z基本互補(bǔ),并且在化合物中定向,從而在適當(dāng)條件下能夠發(fā)生Watson-Crick石咸基配對和雙鏈體形成。119.權(quán)利要求114的方法,其中Y和Z具有相同的長度或不同的長度。120.權(quán)利要求119的方法,其中Y和Z具有相同的長度。121.權(quán)利要求114的方法,其中Y和Z的長度各自為IO個或更多堿基,并且具有IO個或更多堿基對的互補(bǔ)區(qū)。122.權(quán)利要求114的方法,其中S是碳原子、硼原子、氮原子、磷原子或多原子支架。123.權(quán)利要求114的方法,其中S是磷酸基或環(huán)基。124.權(quán)利要求123的方法,其中S是環(huán)烷基、環(huán)烯基、雜環(huán)烷基、雜環(huán)烯基、芳基或雜芳基。125.4又利要求114的方法,其中連接體部分具有結(jié)構(gòu)其中n、m和p各自獨(dú)立地為1至約20的整數(shù)。126.才又利要求125的方法,其中n、m和p各自獨(dú)立地為2至8的整數(shù)。127.沖又利要求126的方法,其中n、m和p各自獨(dú)立地為3至6的整數(shù)。128.權(quán)利要求127的方法,其中連接體部分具有結(jié)構(gòu)129.權(quán)利要求114的方法,其中X和Z包含PCR引物序列。全文摘要本發(fā)明提供一種合成包含編碼寡核苷酸標(biāo)簽的分子文庫的方法。文檔編號C07H21/00GK101233235SQ200680027615公開日2008年7月30日申請日期2006年6月9日優(yōu)先權(quán)日2005年6月9日發(fā)明者B·摩根,C·C·阿里科-米恩德爾,D·I·伊斯雷爾,D·本杰明,G·J·富蘭克林,M·J·卡瓦拉納,M·L·格夫特,M·克拉克,N·J·V·漢森,P·A·森特雷拉,R·A·阿卡雅,R·瓦格納,S·P·克里澤,S·黑爾申請人:普雷西斯藥品公司