專利名稱:適體在蛋白質(zhì)組學(xué)中的用途的制作方法
適體在蛋白質(zhì)組學(xué)中的用途本發(fā)明涉及復(fù)雜混合物中蛋白質(zhì)的鑒定和定量。具體而言,本發(fā)明涉及適體 (aptamer)作為復(fù)雜混合物中蛋白質(zhì)和蛋白質(zhì)數(shù)量的標(biāo)簽(tag)或代替物(proxy)的用途。 在另一個(gè)方面,本發(fā)明涉及下一代多核苷酸測(cè)序方法在蛋白質(zhì)組學(xué)中的用途。蛋白質(zhì)組通常被描述為在生物學(xué)系統(tǒng)(例如細(xì)胞、組織、體液、器官或生物體)中 找到的蛋白質(zhì)的全集。對(duì)天然存在蛋白質(zhì)的研究通常稱作“蛋白質(zhì)組學(xué)”且涵蓋對(duì)在特定 時(shí)間時(shí)和/或在感興趣的內(nèi)部或外部條件下表達(dá)的蛋白質(zhì)組的研究。蛋白質(zhì)組學(xué)方法常常 針對(duì)蛋白質(zhì)組的整體分析且要求能自一份或多份樣品解析、鑒定和定量多種(例如數(shù)百種 或數(shù)千種)蛋白質(zhì)。蛋白質(zhì)組學(xué)的承諾中有其識(shí)別新的生物標(biāo)志物(即作為生物學(xué)指示劑發(fā)出生 理學(xué)狀態(tài)改變(例如由于疾病或治療性干預(yù))的信號(hào)的蛋白質(zhì))的能力。生物標(biāo)志物 發(fā)現(xiàn)通常涉及比較在不同生理學(xué)狀態(tài)中表達(dá)的蛋白質(zhì)組并鑒定其存在或表達(dá)水平在 生理學(xué)狀態(tài)間一致不同(consistently differ)的蛋白質(zhì)(Schrattenholz A, Groebe K. Electrophoresis. (2007) Jun 28(12) 1970-9)。血液中的蛋白質(zhì)是鑒定疾病狀態(tài)和藥物治療標(biāo)志物的特殊靶物。廣泛假設(shè),血液 中的蛋白質(zhì)的量和/或構(gòu)象應(yīng)當(dāng)在統(tǒng)計(jì)上與此類狀況有關(guān),其方式在權(quán)重上超過內(nèi)在的天 然變異性。血液和其它體液是特殊的靶物,因?yàn)樗鼈兘?bathe)受影響組織,轉(zhuǎn)運(yùn)生死攸 關(guān)的蛋白質(zhì)且能在醫(yī)學(xué)會(huì)診過程中使用相對(duì)便宜和直接的規(guī)程獲得供測(cè)試用。然而,血液中的蛋白質(zhì)具有很大范圍的濃度,其中少數(shù)蛋白質(zhì)占比超過所有蛋白 質(zhì)的99. 9%而且其它蛋白質(zhì)占據(jù)的分布為皮克至毫克每毫升(QianW.J.等,Mol. Cell. Prot. (2006) 5 (10) 1727-1744) 0由于現(xiàn)有蛋白質(zhì)組學(xué)技術(shù)的限制,此豐度范圍仍然是假設(shè) 的。蛋白質(zhì)組學(xué)科學(xué)家采用多種方法來達(dá)到此范圍,目的也是使對(duì)蛋白質(zhì)相對(duì)豐度的破壞 最小化。這常常要求通過選擇性純化來排除高豐度的蛋白質(zhì)。還嘗試通過選擇性聚焦樣品 中所有肽的子集來降低所獲得的肽的復(fù)雜性。這些規(guī)程是漫長(zhǎng)的,而且樣品、復(fù)制品、儀器 和實(shí)驗(yàn)室間的再現(xiàn)性仍有待以生物標(biāo)志物蛋白質(zhì)的統(tǒng)計(jì)發(fā)現(xiàn)(statisticaldiscovery)的 必要方式來證明。生物標(biāo)志物發(fā)現(xiàn)中常常使用的基于常規(guī)質(zhì)譜術(shù)(MS)的蛋白質(zhì)組學(xué)通過將生物學(xué) 樣品分開以自所研究的混合物分離單一蛋白質(zhì)來進(jìn)行。最近,這從二維凝膠前進(jìn)至多維基 于柱的高效液相層析(HPLC)。蛋白質(zhì)能被分解成較短的亞基或肽。然后將分離的肽進(jìn)料入 質(zhì)譜儀中,質(zhì)譜儀將肽離子化并使它們進(jìn)一步分解,產(chǎn)生質(zhì)量/電荷測(cè)量的梯狀物。這些測(cè) 量及其豐度也能在多種方案下量化,通常是相對(duì)于一些對(duì)照。然后將所得圖譜梯狀物針對(duì) 已知肽序列或盲目地自原始數(shù)據(jù)進(jìn)行解讀,并使用獲得的質(zhì)量和序列信息來搜索序列數(shù)據(jù) 庫(kù)以鑒定作為各肽起源的蛋白質(zhì)。然而,復(fù)雜生物學(xué)樣品的蛋白質(zhì)水解通常產(chǎn)生數(shù)以十萬計(jì)的肽,它們會(huì)壓倒已知 層析和MS系統(tǒng)的分辨能力,引起不完全的分辨和組分肽鑒定受損。通常,在基于MS的蛋白 質(zhì)組學(xué)中,自樣品得到的圖譜中多達(dá)80%不能正確或一致地重解讀成差別肽或(因此)蛋 白質(zhì)。它們?cè)贛S過程中的片段化行為和豐度也能是依賴背景的,進(jìn)一步使再現(xiàn)性變復(fù)雜(Liu H, Sadygov RG, Yates JR3rd. , Anal. Chem. (2004) Jul 15 76(14)4193-201)。使生物學(xué)樣品的蛋白質(zhì)組分析能夠進(jìn)行的一種方法是在對(duì)所生成的肽混合物進(jìn) 行下游解析和鑒定步驟(如層析分離和/或質(zhì)譜術(shù)(MS))之前,降低由分開此類樣品來產(chǎn) 生的所述肽混合物的復(fù)雜性。理想的是,降低蛋白質(zhì)肽混合物的復(fù)雜性會(huì)降低樣品的每種 個(gè)別蛋白質(zhì)所存在的不同肽的平均數(shù)目,仍會(huì)使肽混合物中實(shí)際呈現(xiàn)的樣品中蛋白質(zhì)的級(jí) 分最大化。蛋白質(zhì)的生物學(xué)加工以使基于MS的確認(rèn)混淆的多種方式使血液(血清或血漿) 的使用進(jìn)一步不明(Qian W. J.等,Mol. Cell. Prot. (2006)5(10) 1727-1744)。最近的研究 顯示了極其矛盾的自臨床樣品鑒定和計(jì)數(shù)蛋白質(zhì)的嘗試。就是以常規(guī)的基于MS的蛋白質(zhì) 組學(xué)分離、斷裂和測(cè)量蛋白質(zhì)的動(dòng)作改變了它們的相對(duì)豐度和化學(xué)組成?;诘鞍踪|(zhì)組學(xué)的分析的輸出是所研究的樣品中顯著關(guān)聯(lián)的蛋白質(zhì)的“命中列 表”。通常,此列表是具有可變統(tǒng)計(jì)意義的蛋白質(zhì)的選集。通常對(duì)該列表進(jìn)行生物學(xué)導(dǎo)向研 究,并對(duì)每個(gè)成員的潛在生物學(xué)意義做出理性選擇。搜索具有推定統(tǒng)計(jì)意義的蛋白質(zhì)或假 定生物標(biāo)志物列表的過程一般稱作“發(fā)現(xiàn)”。然后將努力聚焦于檢驗(yàn)和驗(yàn)證少數(shù)選定的“命中”。這涉及在更寬的臨床樣品群 體中證實(shí)測(cè)量得到的蛋白質(zhì)豐度,目的是顯示所發(fā)現(xiàn)的和所選擇的蛋白質(zhì)是真實(shí)的而非 假陽(yáng)性,而且它們是對(duì)疾病或藥物狀態(tài)特異性的。這種證實(shí)蛋白質(zhì)組學(xué)測(cè)量和推定生物 標(biāo)志物在更一般化的群體中的數(shù)量意義的過程通常稱作“驗(yàn)證”(Zolg,Mol. Cell. Prot. (2006) 5 (10),1720-1726)。這常常要求對(duì)發(fā)現(xiàn)階段使用備選技術(shù)。這通常是使用針對(duì)純化的推定蛋白質(zhì)生成的抗體實(shí)現(xiàn)的。然后能在基于ELISA的 測(cè)定法中針對(duì)數(shù)以百計(jì)的樣品使用這些抗體,再次應(yīng)用相關(guān)統(tǒng)計(jì)學(xué),并確立該蛋白質(zhì)作為 生物標(biāo)志物的有效性。此過程的最終意圖還有使抗體成為臨床測(cè)定法的一部分。然而,抗 體的生成是費(fèi)時(shí)且昂貴的,而且并非總是可能生成對(duì)給定蛋白質(zhì)特異性的抗體。另一項(xiàng)復(fù) 雜因素是蛋白質(zhì)備選變體或同型(isoform)的存在,它們可以在其表面上具有所附著糖分 子的殼和其它修飾。同型在發(fā)現(xiàn)階段基于MS的鑒定中可能是不明顯的,并因此使測(cè)量的 統(tǒng)計(jì)顯著性及特異性抗體的生成變復(fù)雜(Zolg, Mol. Cell. Prot. (2006) 5 (10),1720-1726 ; Rifai 等,Nature Biotech (2006) 24 (8) 971-83)。發(fā)現(xiàn)和驗(yàn)證都具有高失敗率,而且是費(fèi)時(shí)且昂貴的練習(xí)。成功和失敗通常只 能在付出很長(zhǎng)時(shí)間和很多金錢后的驗(yàn)證階段后判斷。因此,最近的努力聚焦于用于發(fā) 現(xiàn)的基于MS的方法的精化和抗體的大量生成,以努力加速發(fā)現(xiàn)、驗(yàn)證及衍生臨床產(chǎn)品 (Anderson 禾口 Hunter,Mol. Cell Prot. (2006) 5 (4) 573-588 ;Zangar φ, Expert Review of Proteomics(2006)3(1)37-44)。因而,顯然需要新方法來審查蛋白質(zhì),特別是自體液得到的復(fù)雜的蛋白質(zhì)混合物。 具體而言,需要鑒定和測(cè)量蛋白質(zhì)豐度,尤其是復(fù)雜混合物中多種蛋白質(zhì)的豐度的技術(shù),它 要克服技術(shù)缺點(diǎn)及妨礙當(dāng)前技術(shù)的科學(xué)和成本約束。具體而言,需要工具來取代昂貴且有 時(shí)不可靠的抗體生成和使用以鑒定和驗(yàn)證靶蛋白質(zhì)。此類工具還能用于代替現(xiàn)有的基于發(fā) 現(xiàn)的技術(shù),如MS,前提是能足夠快速且便宜地生成有足夠多樣性的抗體備選物來探查生物 學(xué)樣品中的全范圍的天然蛋白質(zhì)。對(duì)此類工具的明顯要求是對(duì)混合物的最小限度操作,從而可獲得樣品中蛋白質(zhì)以其天然構(gòu)造以及任何天然修飾和變異的真實(shí)呈現(xiàn)。此類工具還應(yīng)是高度且準(zhǔn)確可再現(xiàn)的。適體是形成限定明確的三維形狀,從而容許它們以與抗體在概念上相似的方式結(jié) 合靶分子的短聚合物,通常是核酸(DNA、RNA、PNA)。適體組合了小分子和抗體的最佳特征, 包括高特異性和親和力、化學(xué)穩(wěn)定性、低免疫原性、和靶蛋白質(zhì)-蛋白質(zhì)相互作用的能力。 在高特異性之外,適體對(duì)它們的靶物具有非常高的親和力。通常,針對(duì)蛋白質(zhì)生成的適體具 有皮摩爾至低納摩爾范圍內(nèi)的親和力。與單克隆抗體不同,適體是化學(xué)合成的,而非生物表 達(dá)的,從而提供重大成本優(yōu)勢(shì)。雖然適體提供了抗體的有用且有效的備選,仍然有如何經(jīng)由適體對(duì)蛋白質(zhì)定量的 問題。復(fù)雜的蛋白質(zhì)混合物及生物學(xué)樣品中存在的大動(dòng)態(tài)范圍的蛋白質(zhì)提供了特別的問 題。通常,使用放射性標(biāo)記物對(duì)適體定量。雖然放射性標(biāo)記物的定量是可接受的,而且已經(jīng) 使用多年,但是仍然需要改進(jìn)和加速定量,以及改進(jìn)準(zhǔn)確度和再現(xiàn)性。如此,最廣義地,本發(fā)明涉及一種用于測(cè)量生物學(xué)樣品中至少一種分子的量的方 法,該方法包括a)將所述樣品或其衍生物與一種或多種適體組合并容許所述樣品中的一種或多 種分子結(jié)合至所述適體;b)將結(jié)合的分子與未結(jié)合的分子分開;并c)對(duì)結(jié)合至所述或每種適體的分子定量,其中對(duì)結(jié)合的分子的定量是通過對(duì)所述或每種適體的至少一部分測(cè)序來進(jìn)行的。換言之,本發(fā)明涉及適體作為標(biāo)簽用于對(duì)蛋白質(zhì)定量的用途,其中所述適體的序 列就是所述標(biāo)簽??衫斫獾氖牵m體具有可閱讀的獨(dú)特序列,例如像條形碼一樣。依照本發(fā) 明,此獨(dú)特條形碼成為該條形碼(適體)所結(jié)合的每種蛋白質(zhì)的標(biāo)簽。通過閱讀條形碼(對(duì) 適體測(cè)序),消除了對(duì)另外的標(biāo)簽和/或標(biāo)記物的需要。與現(xiàn)有方法不同,適體序列作為標(biāo)簽的用途容許只使用單一分子實(shí)體進(jìn)行蛋白質(zhì) 鑒定和定量。事實(shí)上,對(duì)適體測(cè)序容許對(duì)每種獨(dú)特序列的情況或出現(xiàn)計(jì)數(shù),因此容許直接對(duì) 每種適體所結(jié)合的蛋白質(zhì)定量。換言之,當(dāng)各適體結(jié)合各蛋白質(zhì)時(shí),每種適體成為樣品或蛋 白質(zhì)混合物內(nèi)蛋白質(zhì)的直接呈現(xiàn)。可理解的是,經(jīng)由本發(fā)明的方法,對(duì)初始蛋白質(zhì)或樣品的 操作降至最少,由此容許盡可能接近天然狀態(tài)地審查蛋白質(zhì)或蛋白質(zhì)混合物。這樣,可獲得 蛋白質(zhì)或蛋白質(zhì)群體的真實(shí)圖像。在一個(gè)優(yōu)選的實(shí)施方案中,對(duì)適體測(cè)序是在沒有擴(kuò)增的情況中實(shí)現(xiàn)的,所以通過 對(duì)如下的測(cè)序裝置上每個(gè)種類的出現(xiàn)計(jì)數(shù)來獲得適體的絕對(duì)或數(shù)字計(jì)數(shù),該測(cè)序裝置在測(cè) 序之前將各分子分開,例如“下一代"DNA測(cè)序儀。獲得每種序列的出現(xiàn)的直接計(jì)數(shù),它又等 于適體所結(jié)合的蛋白質(zhì)的絕對(duì)計(jì)數(shù)??梢詫⑿蛄凶蛹尸F(xiàn)在計(jì)數(shù)裝置上,這應(yīng)當(dāng)是所研究 的分子群體中給定序列的出現(xiàn)的代表性樣品。再一次,這與當(dāng)前的適體定量方法不同,后者 通常要求擴(kuò)增結(jié)合的標(biāo)簽或擴(kuò)增適體分子,從而產(chǎn)生其相對(duì)豐度的模擬估值(如專利公開 號(hào)US 2007-0166741中所記載的)。這是由于為了鑒定結(jié)合蛋白質(zhì)的適體而使用標(biāo)記物和 別的標(biāo)簽的限制。結(jié)果,定量與實(shí)際豐度(即模擬信號(hào))成比例,而不能分辨絕對(duì)或個(gè)別出 現(xiàn)。使用適體序列作為標(biāo)簽的另一項(xiàng)優(yōu)勢(shì)是序列提供極大范圍的可能標(biāo)簽。例如,四 個(gè)堿基的序列提供256種不同組合及如此256種可能的獨(dú)特標(biāo)識(shí)符或標(biāo)簽。如此,雖然可
6以獲得整個(gè)適體序列,但是測(cè)序的核苷酸數(shù)目只需要足以鑒定特定適體就夠了。換言之,或 者整個(gè)適體序列作為標(biāo)簽,或者標(biāo)簽是適體序列的一部分。雖然本發(fā)明的方法可用于用一種適體序列對(duì)樣品中的一種蛋白質(zhì)定量,但是本發(fā) 明的另一項(xiàng)優(yōu)勢(shì)是由獨(dú)特序列提供的可能的標(biāo)簽的范圍容許同時(shí)對(duì)同一樣品中的多種蛋 白質(zhì)定量。如此,可以使用一組已知適體序列或已知適體序列文庫(kù)來對(duì)復(fù)雜混合物中的多 種蛋白質(zhì)定量,而且這樣,本發(fā)明容許審查復(fù)雜生物學(xué)樣品。另外,一組適體或適體文庫(kù)可 以靶向特定蛋白質(zhì),特別是已知在樣品中少量存在的蛋白質(zhì)。因?yàn)槭褂靡阎椒ú惶赡?鑒定和定量樣品中的低豐度蛋白質(zhì),所以本發(fā)明提供了用于審查這些小且至今難以捉摸的 群體的解決方案。文庫(kù)或組應(yīng)當(dāng)理想地含有過度的適體種類來探查樣品。本發(fā)明可分析一種蛋白質(zhì)(例如凝膠切下的蛋白質(zhì)),而且特別適合于分析蛋白 質(zhì)混合物,包括復(fù)雜蛋白質(zhì)混合物。術(shù)語(yǔ)“蛋白質(zhì)的混合物”或“蛋白質(zhì)混合物,,一般指兩 種或更多種蛋白質(zhì)的混合物,例如包含兩種或更多種不同蛋白質(zhì)的組合物。在優(yōu)選的實(shí)施方案中,要分析的蛋白質(zhì)混合物可包括超過約10、優(yōu)選超過約50、 甚至更優(yōu)選超過約100、仍更優(yōu)選超過約500種不同蛋白質(zhì),如例如超過約1000或超過約 5000種不同蛋白質(zhì)。一種例示性復(fù)雜蛋白質(zhì)混合物可涉及而非限于生物學(xué)樣品或其部分中 存在的所有或部分蛋白質(zhì)。如本文中所使用的,術(shù)語(yǔ)“生物學(xué)樣品”或“樣品” 一般指自生物學(xué)來源獲得的未 純化或純化形式的材料。舉例而言,而非限制,樣品可以獲得自病毒,例如原核或真核宿 主的病毒;原核細(xì)胞,例如細(xì)菌或古細(xì)菌,例如自由活動(dòng)的(free-living)或浮游的原核生 物或者包含原核生物的集落或生物膜;真核細(xì)胞或其細(xì)胞器,包括自體內(nèi)或原位獲得的或 體外培養(yǎng)的真核細(xì)胞;真核組織或生物體,例如來自真核組織或生物體的,含有細(xì)胞的或不 含細(xì)胞的樣品;真核生物可包含原生生物(例如原生動(dòng)物或藻類)、真菌(例如酵母菌或 霉菌)、植物和動(dòng)物(例如哺乳動(dòng)物,人類或非人哺乳動(dòng)物)。“生物學(xué)樣品”可如此涵蓋 例如細(xì)胞、組織、生物體、或其提取物??梢詢?yōu)選通過合適方法自其生物學(xué)來源(例如自動(dòng) 物,如哺乳動(dòng)物,人類或非人哺乳動(dòng)物)移出生物學(xué)樣品,如但不限于收集或采集尿液、唾 液、痰、精液、乳、粘液、汗液、糞便等,采集血液、腦脊髓液、間質(zhì)液、眼液(玻璃體)或滑液, 或組織活檢、切除術(shù)、等??梢赃M(jìn)一步細(xì)分生物學(xué)樣品以分離或富集其一部分,該部分要用 于獲得本發(fā)明中所分析的蛋白質(zhì)。舉例而言,而非限制,可以將多種組織類型彼此分開; 可以自樣品分離特定細(xì)胞類型或細(xì)胞表型,例如使用FACS分選、抗體淘選、激光捕捉解剖 (laser-capture dissection)等;可以將細(xì)胞與間質(zhì)液分開,例如可以將血細(xì)胞與血漿或 血清分開;等等??梢灾苯訉悠窇?yīng)用于本發(fā)明的方法,或者可以在使用前將樣品加工、提 取或純化至不同程度。可以自健康受試者或患有狀況、病癥、疾病或感染的受試者得到樣品。例如,而非 限制,受試者可以是健康的動(dòng)物(例如人類或非人哺乳動(dòng)物),或者具有癌癥、炎性疾病、自 身免疫性疾病、代謝病、CNS疾病、眼科疾病、心臟病、肺病、肝病、胃腸病、神經(jīng)變性性疾病、 遺傳病、傳染病、或病毒感染、或其它病的動(dòng)物(例如人類或非人哺乳動(dòng)物)。優(yōu)選的是,可以處理自生物學(xué)樣品得到的蛋白質(zhì)混合物以從中消減高豐度蛋白 質(zhì),從而提高蛋白質(zhì)組分析的靈敏度和性能。舉例而言,哺乳動(dòng)物樣品(如人類血清或血 漿樣品)可以包括含量豐富的蛋白質(zhì),例如清蛋白、IgG、抗胰蛋白酶、IgA、運(yùn)鐵蛋白、觸珠蛋白(haptoglobin)和纖維蛋白原(fibrinogen),可以優(yōu)選自樣品如此消減它們。用于 清除含量豐富的蛋白質(zhì)的方法和系統(tǒng)是已知的,如例如免疫親和消減,而且通常是商業(yè)上 可得到的,例如Agilent Technologies (Santa Clara, California)的多重親和清除系統(tǒng) (MARS-7, MARS-14)。雖然本發(fā)明具有蛋白質(zhì)定量的具體應(yīng)用,但是可理解的是,本發(fā)明還具有其它分 子(如代謝物)定量及潛在小分子和生物學(xué)治療劑鑒定的應(yīng)用。在一個(gè)實(shí)施方案中,本發(fā)明使用下一代多核苷酸測(cè)序技術(shù)來鑒定和定量適體標(biāo) 簽。這樣,本發(fā)明提供了與當(dāng)前可用方法相比更靈敏且有效的定量方法,并在蛋白質(zhì)組學(xué)領(lǐng) 域中利用由這種基因組方法提供的大動(dòng)態(tài)范圍、特異性和靈敏度。下一代多核苷酸測(cè)序技術(shù)要求將DNA或RNA或其它多核苷酸序列的各分子分離到 表面(如珠或芯片)上,由此創(chuàng)建序列的單分子陣列。該陣列的表面密度容許每個(gè)分子得 到個(gè)別分辨,例如通過光學(xué)顯微術(shù)。在陣列上對(duì)多核苷酸分子的測(cè)序容許對(duì)序列進(jìn)行“數(shù) 字”(即絕對(duì))計(jì)數(shù),如此對(duì)陣列上存在的序列直接定量。在一些技術(shù)中,一旦排列就可以 克隆擴(kuò)增序列以加強(qiáng)和/或闡明來自每種序列的信號(hào)。但是,通過對(duì)陣列上序列的出現(xiàn)而 非自每種擴(kuò)增子生成的信號(hào)計(jì)數(shù)來獲得定量。合適的測(cè)序和定量技術(shù)的例子可見于出版物 中,如 WO 00/006770 和 Branton 等(Nature Biotechnology (2008) 26 1146-1153)。因而,在一個(gè)優(yōu)選的實(shí)施方案中,對(duì)結(jié)合的適體序列的定量是使用結(jié)合的序列的 單分子陣列進(jìn)行的?;蛘?,可以在克隆陣列上對(duì)適體序列定量,其中在表面上排列后擴(kuò)增每 種序列。由于適體對(duì)其靶蛋白質(zhì)的高特異性,可以使用適體作為混合物內(nèi)蛋白質(zhì)的代替 物。結(jié)合于其蛋白質(zhì)和后續(xù)洗脫后,經(jīng)由對(duì)其序列在平行測(cè)序裝置上的頻率計(jì)數(shù)來對(duì)適體 定量,從而能夠?qū)悠穬?nèi)的特定蛋白質(zhì)定量。通過暗示或代替,這與使用抗體作為蛋白質(zhì)的 代替物的方式相似。事實(shí)上,適體序列或標(biāo)簽的分布代表獲得蛋白質(zhì)的生物學(xué)群體或樣品 中相應(yīng)蛋白質(zhì)的分布。此外,在陣列上對(duì)克隆分子計(jì)數(shù)為每種適體標(biāo)簽的數(shù)量或比例提供絕對(duì)數(shù)。這稱 作“數(shù)字計(jì)數(shù)”,而且與現(xiàn)有的DNA/RNA定量方法不同,后者依賴如附著染料的熒光等參數(shù) 的間接模擬測(cè)量。這樣,不需要操作蛋白質(zhì)或蛋白質(zhì)混合物,除了在合適條件下暴露適體。 另外,認(rèn)為數(shù)字計(jì)數(shù)是卓越的,因?yàn)樗苊饬四M定量的許多含混(ambiguity)和信號(hào)噪 聲問題(Smyth GK, Bioinformatics (2007) Sep 19)。在一個(gè)具體的實(shí)施方案中及如
圖1所示,針對(duì)自生物學(xué)材料(例如血清)得到的 體外折疊蛋白質(zhì)集篩選并選擇適體文庫(kù)??衫斫獾氖牵梢酝ㄟ^任何方法來生成適體標(biāo)簽 文庫(kù),包括SELEX和共同待審的(co-pending)申請(qǐng)?zhí)朎P07020629. 7中記載的方法。清除或洗脫不結(jié)合蛋白質(zhì)的適體。為了實(shí)現(xiàn)這一點(diǎn),有多種已知選項(xiàng)可用。例如, 可用在固體支持物上固定化一種蛋白質(zhì)或復(fù)雜蛋白質(zhì)樣品??梢詫?shí)施嚴(yán)格清洗來清除不 結(jié)合的和弱結(jié)合的適體。另一個(gè)選項(xiàng)是使用蛋白質(zhì)靶物上適體的可逆交聯(lián)(光適體)。也 可以采用基于平衡混合物的平衡毛細(xì)管電泳(ECEEM)或非平衡變體(NECEEM)的非SELEX 辦法來快速選擇具有規(guī)定結(jié)合特性的“聰明”適體(Drabovich等,Anal. Chem. (2006)78, 3171-3178)。自它們的蛋白質(zhì)宿主移除剩余的、結(jié)合的適體,并運(yùn)行穿過(rim through)下一代測(cè)序儀,由此對(duì)它們測(cè)序和計(jì)數(shù)。作為下一代測(cè)序的一個(gè)具體例子,將結(jié)合的適體隨機(jī)排列在表面(如珠或芯片) 上。任選地循環(huán)擴(kuò)增適體,在表面上的離散χ和y坐標(biāo)處或在各珠上產(chǎn)生多組克隆單鏈分 子。序列結(jié)合至陣列后,將引物添加至每個(gè)序列。然后DNA測(cè)序儀執(zhí)行逐步化學(xué),該逐步化 學(xué)由容許每個(gè)循環(huán)測(cè)定每個(gè)互補(bǔ)序列上一個(gè)堿基的試劑組成。這樣,確立反映每個(gè)結(jié)合的 適體序列的互補(bǔ)序列。照明和成像系統(tǒng)容許此過程被拍照,而且通過多次重復(fù)規(guī)程,能獲得 初始適體的序列。此類技術(shù)通常能夠?qū)Τ^0. 4-1億種長(zhǎng)達(dá)50個(gè)堿基對(duì)的DNA片段測(cè)序, 而且這些數(shù)目正在快速增長(zhǎng)。從樣品準(zhǔn)備到測(cè)序輸出,此過程目前需要少于1-3天,而且這 些時(shí)間表(time scale)正在縮短??衫斫獾氖?,可以使用落在“下一代多核苷酸測(cè)序”范疇中的其它方法,而且本發(fā) 明不限于所提供的具體例子。“下一代多核苷酸測(cè)序”是一般用來描述自2004年出現(xiàn)的 DNA/RNA測(cè)序平臺(tái)的新創(chuàng)術(shù)語(yǔ)。它們的共同特征是它們使用與基于“Sanger”測(cè)序的舊技術(shù) 不同的測(cè)序化學(xué)。新平臺(tái)使用新化學(xué)且一般具有很高的通量和低得多的成本。這是通過平 行運(yùn)行測(cè)序反應(yīng)的能力來實(shí)現(xiàn)的。新平臺(tái)通常通過合成或鏈延伸(建造)來行進(jìn),與通過 剪斷堿基(降解)來運(yùn)轉(zhuǎn)的Sanger法不同。另外,新平臺(tái)操作微量的克隆分子,與具有很 大的DNA測(cè)序儀分子對(duì)堿基測(cè)量比的Sanger法不同。也可理解的是,雖然提到了 DNA測(cè)序,但是DNA測(cè)序技術(shù)也可用于RNA或PNA (肽 核酸)序列。如此,提到下一代測(cè)序儀或測(cè)序涵蓋DNA、RNA和PNA,以及基于核酸的聚合物 的所有其它化學(xué)變體及其類似物,它們適合于在本發(fā)明的方法中使用。雖然本發(fā)明的一個(gè)優(yōu)選實(shí)施方案使用適體序列的二維陣列,但是本發(fā)明涵蓋溶液 中的和三維的下一代測(cè)序。對(duì)于后者,可以連鎖標(biāo)簽以提高陣列的動(dòng)態(tài)范圍。本發(fā)明的一項(xiàng)重大優(yōu)勢(shì)是可以在一項(xiàng)測(cè)定法或?qū)嶒?yàn)中使用針對(duì)不同蛋白質(zhì)的多 種適體來審查復(fù)雜蛋白質(zhì)混合物,由此能夠平行地對(duì)一份樣品中的多種蛋白質(zhì)定量。此多 重性顯然適應(yīng)高通量測(cè)定法,如下一代測(cè)序。認(rèn)為在聯(lián)合使用時(shí),多種蛋白質(zhì)充當(dāng)特異和靈 敏生物標(biāo)志物的力量在權(quán)重上遠(yuǎn)遠(yuǎn)勝過一種蛋白質(zhì)的使用,因?yàn)槎喾N生物標(biāo)志物在患病狀 態(tài)中通常共同地而非個(gè)別地起作用。理想的是,文庫(kù)適體序列包含對(duì)一種蛋白質(zhì)特異性的適體序列池(pool)。或者,該 池包含對(duì)超過一種蛋白質(zhì)特異性的適體序列。例如,該文庫(kù)可以含有已知對(duì)蛋白質(zhì)A特異 性的適體序列al、a2和a3?;蛘?,該文庫(kù)可以含有適體序列al、a2和a3,以及對(duì)蛋白質(zhì)B 特異性的bl和b2,cl等。雖然適體序列al、a2和a3可以是對(duì)蛋白質(zhì)A特異性的,但是本 發(fā)明涵蓋如下的情況,例如適體序列a2對(duì)蛋白質(zhì)B也是特異性的。換言之,適體文庫(kù)可以 含有離散地對(duì)蛋白質(zhì)特異性的序列,以及結(jié)合超過一種蛋白質(zhì)的序列。后一種情況當(dāng)在混 合物中搜索相關(guān)蛋白質(zhì)家族和組時(shí)可能是有用的。雖然優(yōu)選所述或每種適體所結(jié)合的蛋白質(zhì)或分子的身份是已知的,但是此類特征 不是至關(guān)重要的。例如,適體所結(jié)合的蛋白質(zhì)的類別可以是已知的,但是該類別的具體成員 在患病狀態(tài)中可發(fā)生改變。一旦完成定量,就可以闡明蛋白質(zhì)的身份。例如,可以針對(duì)蛋白 質(zhì)混合物測(cè)定一種或多種特異性適體。適體特異性結(jié)合感興趣蛋白質(zhì),然后可以自混合物 分離和純化感興趣蛋白質(zhì)。本發(fā)明的一項(xiàng)重大優(yōu)勢(shì)是直到審查過程結(jié)束時(shí)才需要確定蛋白 質(zhì)生物標(biāo)志物的實(shí)際鑒定。如此,審查期間不需要操作蛋白質(zhì)樣品。
可理解的是,可以通過任何已知方法來進(jìn)行多肽測(cè)序。例如,可以在柱上固定化感 興趣適體,使蛋白質(zhì)混合物流過柱,并使用常規(guī)的基于MS的蛋白質(zhì)組學(xué)分析與柱上結(jié)合于 適體的蛋白質(zhì)。在另一個(gè)實(shí)施方案中,適體攜帶獨(dú)特的序列標(biāo)簽。這樣,一旦適體被鑒定為結(jié)合一 種或多種感興趣蛋白質(zhì),就可以自適體移除標(biāo)簽,然后對(duì)標(biāo)簽測(cè)序和計(jì)數(shù)。這樣,使用標(biāo)簽 作為適體的地址并提供備選方法來提供定量??衫斫獾氖?,該方法可用于提供多種解決方案和答案。具體而言,該方法可用于審 查生物學(xué)樣品以確定與健康狀態(tài)相比某些蛋白質(zhì)或分子在疾病狀態(tài)是否上調(diào)或下調(diào)。因?yàn)?可以同時(shí)使用多組適體,所以本發(fā)明容許同時(shí)審查多種潛在和/或已知生物標(biāo)志物。適體 序列作為標(biāo)簽的使用(而非間接標(biāo)簽和標(biāo)志物,如放射性標(biāo)記物和抗體)容許鑒定上調(diào)和 下調(diào)的分子,以及翻譯后修飾的改變、構(gòu)象變化、變體出現(xiàn)等等。這樣,能被鑒定的可能生物 標(biāo)志物的細(xì)查(canvass)比使用當(dāng)前可用技術(shù)時(shí)可能的情況寬得多。事實(shí)上,可以使用聚焦適體集選擇性地審查蛋白質(zhì)組的特定區(qū)域。另外,因?yàn)檫m體 序列提供這樣大范圍的可能標(biāo)簽,所以可以同時(shí)審查蛋白質(zhì)組的多個(gè)離散區(qū)域。在又一個(gè)實(shí)施方案中,可以用復(fù)雜樣品考驗(yàn)適體組或池。然后可以洗脫結(jié)合級(jí)分, 并針對(duì)第二份不同樣品再探查。然后游離的、未結(jié)合的適體反映蛋白質(zhì)豐度的差異。這樣, 能測(cè)量例如作為患病或處理后狀態(tài)的結(jié)果而發(fā)生的蛋白質(zhì)豐度的變化,以及樣品中出現(xiàn)的 任何蛋白質(zhì)的出現(xiàn)。在這些實(shí)施方案中,復(fù)雜蛋白質(zhì)混合物通常是自體液(如血液、血漿或 血清)得到的。可理解的是,本發(fā)明還可用于驗(yàn)證生物標(biāo)志物。具體而言,可以針對(duì)來自一名或多 名健康個(gè)體的蛋白質(zhì)樣品篩選一組或一套不同適體,并與自患有感興趣疾病的一名或多名 個(gè)體采集的蛋白質(zhì)樣品比較。因?yàn)榭梢酝瑫r(shí)對(duì)多種蛋白質(zhì)定量,所以本發(fā)明高度適應(yīng)高通量分析,由此顯著降 低生物標(biāo)志物驗(yàn)證通常所需要的成本和時(shí)間。本發(fā)明關(guān)于驗(yàn)證蛋白質(zhì)生物標(biāo)志物的一項(xiàng)優(yōu)勢(shì)是可使用適體來代替抗體。特異性 抗體的生成是昂貴的,而且并非總是成功的。另一方面,通??赡軐?duì)給定過程生成選擇性適 體,而且該過程快速且便宜得多。在使用時(shí),針對(duì)復(fù)雜蛋白質(zhì)混合物測(cè)定對(duì)特定感興趣蛋白 質(zhì)特異性的一種或多種適體。與患病樣品中的結(jié)合相比健康樣品中適體結(jié)合的缺失(或反 之亦可)可以通過適體計(jì)數(shù)來闡明。再次,無需對(duì)蛋白質(zhì)樣品進(jìn)行操作,而且蛋白質(zhì)本身不 需要鑒定。另外,可以在一項(xiàng)實(shí)驗(yàn)中針對(duì)多種感興趣蛋白質(zhì)測(cè)定多種適體。通過能夠?qū)彶榈鞍踪|(zhì)的全集(full complement),本發(fā)明的方法還可用于建立個(gè) 體中蛋白質(zhì)的構(gòu)象和豐度的圖像。也就是,提供患者的蛋白質(zhì)組成的序型或圖譜。例如,可 以使用前列腺特異性抗原(PSA)的圖像來建立前列腺癌的預(yù)后和診斷,以及提供疾病進(jìn)展 的指示。又例如,如果發(fā)現(xiàn)患者具有某種蛋白質(zhì)變體,那么關(guān)于患者的蛋白質(zhì)序型的信息 可用于評(píng)估疾病預(yù)后或易感性,而且可用于幫助為患者開發(fā)個(gè)性化治療方案。例如,在他們 的CCR5基因中攜帶特定突變的人可生成CCR5受體變體。這些受體變體不結(jié)合HIV,因此攜 帶受體變體的人變成HIV+及因此進(jìn)展至AIDS的機(jī)會(huì)較低。通過確定相同樣品的復(fù)制品之間的變異,以及自不同個(gè)體獲得的樣品之間的變異,本發(fā)明還可用于測(cè)定適體對(duì)單一分子(如蛋白質(zhì))的特異性。本發(fā)明的用途還在于診斷法。具體而言,已知鑒定經(jīng)過驗(yàn)證的生物標(biāo)志物的一種 或多種適體可簡(jiǎn)單地用于審查自個(gè)體采集的體液,如血液或血清。因?yàn)檫m體的結(jié)合指示了 蛋白質(zhì)的存在,所以可以使用一組適體來鑒定已知在異常狀態(tài)中發(fā)生改變的一種或一組生 物標(biāo)志物蛋白質(zhì)。例如,可以使用序型分析來針對(duì)已知基線評(píng)估特定蛋白質(zhì)的數(shù)量。此類 用途的例子有作為妊娠測(cè)試或PSA水平測(cè)試的用途。又例如,敗血癥是一種異常狀態(tài),其中 已知許多因子根據(jù)敗血癥的類型和感染的階段而上調(diào)或下調(diào)。此類診斷法可以是試劑盒的形式,其包括一組適體,該適體的結(jié)合指示自個(gè)體衍 生的生物學(xué)樣品中已知對(duì)特定異常狀態(tài)特異性的生物標(biāo)志物的存在。在另一個(gè)實(shí)施方案中,本發(fā)明可用于測(cè)定疾病進(jìn)展。例如,敗血癥中的生物標(biāo)志物 樣式在感染過程里有變化。鑒定生物標(biāo)志物作為敗血癥進(jìn)展指示劑會(huì)大大有助于制定適宜 的治療方案。本發(fā)明還容許進(jìn)行患者序型分析,其又可用于指導(dǎo)治療方案和可能的預(yù)防處理。如此,本發(fā)明提供了單一平臺(tái),在該平臺(tái)上可實(shí)現(xiàn)多種輸出。在又一個(gè)方面,本發(fā)明涵蓋克隆或單一分子陣列用于適體測(cè)序和計(jì)數(shù)的用途。發(fā)明人認(rèn)識(shí)到可以理想地對(duì)適體進(jìn)行適應(yīng)性修改,以增強(qiáng)它們與下一代DNA測(cè)序 平臺(tái)的相容性。因此,可以增強(qiáng)適體,從而能夠使用此類技術(shù)平臺(tái)來進(jìn)行適體測(cè)序和鑒定。 如此,從另一方面看,本發(fā)明涵蓋包含適體序列和銜接頭序列的能夠測(cè)序的適體。銜接頭序 列包含如下的序列,該序列使適體能夠附接于表面,從而能夠?qū)m體測(cè)序。能夠測(cè)序的適體可以另外包含用于對(duì)適體測(cè)序的測(cè)序引物。此類構(gòu)建物可以包括超過一個(gè)測(cè)序和附著銜接頭。例如,適體序列可以?shī)A在退火 至適體序列每個(gè)末端的測(cè)序和附著銜接頭對(duì)之間。能夠測(cè)序的適體還可以包含標(biāo)記物,從而能夠進(jìn)行適體顯現(xiàn)。可理解的是,可以使 用任何合適的標(biāo)記物,包括熒光標(biāo)記物和放射性標(biāo)記物。本發(fā)明的能夠測(cè)序的適體可以在上文所述方法、用途、和診斷試劑盒中使用。下面經(jīng)由非限制性實(shí)施例來描述本發(fā)明,其中圖1圖示了本發(fā)明的方法,其中將適體序列文庫(kù)與血清蛋白質(zhì)組混合。洗脫結(jié)合 的適體/蛋白質(zhì)級(jí)分,之后在第二代測(cè)序儀上測(cè)序和計(jì)數(shù)。來自測(cè)序儀的輸出是結(jié)合的級(jí) 分中存在的每種序列的數(shù)目。圖2圖示了該方法用于生物標(biāo)志物發(fā)現(xiàn)的用途,其中將來自不同患者的蛋白質(zhì)組 與基線或?qū)φ毡容^。圖3圖示了本發(fā)明的一個(gè)備選實(shí)施方案中,其中將適體文庫(kù)與第一血清蛋白質(zhì)組 樣品混合。對(duì)結(jié)合的級(jí)分定量后,擴(kuò)增血清樣品內(nèi)與感興趣蛋白質(zhì)結(jié)合的適體群體并與第 二血清蛋白質(zhì)組樣品混合。然后進(jìn)行第一和第二相應(yīng)定量輸出的比較。圖4的層析圖顯示了將等體積的150nM IgE和IOOnM ProNuclFR溫育30分鐘后 獲得的混合物的不同成分。圖 5 顯示了與恒定的(IOOnM) ProNuclF 濃度一起溫育的 0/20/40. · · 2000nM IgE(自底部至頂部)的CE層析圖。圖6的圖顯示了對(duì)不同蛋白質(zhì)濃度作圖的結(jié)合的ProNuclF的級(jí)分。
11
圖7是適體的下一代測(cè)序的適應(yīng)樣品制備方案的示意圖。圖8的圖顯示了使用兩種不同分析方法找回的IgE適體序列的絕對(duì)計(jì)數(shù)。圖9的圖顯示了針對(duì)摻入無關(guān)(PhiX)序列混合物中的序列數(shù)目繪圖的通過下一 代測(cè)序計(jì)數(shù)得到的、序列混合物中存在的IgE適體序列的級(jí)分。實(shí)施例1此實(shí)施例圖示于圖1,其顯示了使用適體標(biāo)簽文庫(kù)對(duì)血清樣品中的蛋白質(zhì)定量。針 對(duì)自血清得到的蛋白質(zhì)混合物篩選已知適體的多樣性文庫(kù)。在固體支持物上固定化蛋白質(zhì) 混合物并實(shí)施嚴(yán)格清洗以清除未結(jié)合的和弱結(jié)合的適體。然后自它們的蛋白質(zhì)宿主清除剩余的結(jié)合的適體,并在下一代測(cè)序儀上測(cè)序和計(jì) 數(shù)。排列后,可通過標(biāo)準(zhǔn)方法(如PCR)來擴(kuò)增結(jié)合的適體序列以提高測(cè)序儀上信號(hào)相對(duì)于 背景噪聲的清晰度。來自測(cè)序儀的輸出會(huì)是如由適體文庫(kù)呈現(xiàn)的、生物學(xué)樣品中存在的蛋白質(zhì)的絕對(duì)定量。實(shí)施例2對(duì)于在生物標(biāo)志物發(fā)現(xiàn)中的用途和如圖2所示,針對(duì)自不同個(gè)體得到的樣品篩選 適體文庫(kù)。還會(huì)要求合適數(shù)目的已知對(duì)照或健康樣品來建立基線或健康狀況。還會(huì)篩選一 定數(shù)目的、已知呈現(xiàn)疾病狀態(tài)的樣品。兩個(gè)群體(健康的對(duì)患病的)的比較會(huì)容許鑒定在兩 個(gè)群體間顯示顯著變化的適體。一旦闡明每種適體的序列,就可鑒定適體所結(jié)合的蛋白質(zhì)。 蛋白質(zhì)的鑒定可以通過下一代測(cè)序技術(shù)或基于蛋白質(zhì)組的方法(如層析和MS)來進(jìn)行。實(shí)施例3此實(shí)施例描述了本發(fā)明的一種備選方法且圖示于圖3。針對(duì)第一生物學(xué)樣品篩選適體文庫(kù)。與實(shí)施例1或?qū)嵤├? —樣,清除未結(jié)合的 適體,自它們的宿主蛋白質(zhì)釋放剩余的結(jié)合的適體,并在下一代測(cè)序儀上測(cè)序和計(jì)數(shù)。然后針對(duì)第二生物學(xué)樣品篩選結(jié)合至第一樣品中蛋白質(zhì)的序列群。如前所述,丟 棄未結(jié)合的適體,并對(duì)剩余的適體測(cè)序和計(jì)數(shù)。如果這兩份樣品是自健康受試者得到的,那 么這兩份樣品之間的任何變化可歸于正常群體內(nèi)的變異。類似的,自已知患有特定疾病的 患者得到的兩份樣品的輸出之間的任何變化也可歸因于變異。然而,健康受試者與患病受 試者之間的任何顯著變異可歸因于由感興趣疾病引起的蛋白質(zhì)群體的變化。然后可以翻譯 其中找到顯著變化的適體序列以鑒定適體所結(jié)合的蛋白質(zhì)。實(shí)施例4在此實(shí)施例中,適體文庫(kù)包含至少一個(gè)對(duì)一種蛋白質(zhì)特異性的適體集合。同樣地, 該組可含有多個(gè)適體集合,其中每個(gè)集合是對(duì)不同蛋白質(zhì)特異性的。蛋白質(zhì)混合物可以僅僅是生物學(xué)樣品,如血液或血清?;蛘撸鞍踪|(zhì)混合物可以是 通過對(duì)生物學(xué)樣品富集蛋白質(zhì)級(jí)分而獲得的。在此實(shí)施例中,必須小心使對(duì)蛋白質(zhì)群體的 破壞和變性最小化。針對(duì)蛋白質(zhì)混合物篩選已知的、選定的適體序列的文庫(kù)。在一個(gè)例子中,使蛋白質(zhì) 混合物結(jié)合至柱,并讓該組適體流過柱。清除不結(jié)合的適體。自它們的蛋白質(zhì)宿主移出結(jié) 合的適體,并在下一代測(cè)序儀上測(cè)序和計(jì)數(shù)。如果感興趣的蛋白質(zhì)確實(shí)是疾病狀態(tài)的生物標(biāo)志物,那么適體可見于來自患病樣品的結(jié)合級(jí)分且不見于自健康個(gè)體得到的樣品?;蛘?,蛋白質(zhì)作為生物標(biāo)志物的作用可表 現(xiàn)為與健康受試者相比時(shí)患病個(gè)體中蛋白質(zhì)的上調(diào)或下調(diào)。實(shí)施例5在此實(shí)施例中,適體文庫(kù)含有已知對(duì)一種或多種蛋白質(zhì)特異性的一種或多種序 列。每種感興趣蛋白質(zhì)的身份也是已知的。文庫(kù)可包含對(duì)單一蛋白質(zhì)特異性的單一集合, 或者它可以包含對(duì)多種(an array of)蛋白質(zhì)特異性的多個(gè)集合。針對(duì)自個(gè)體得到的生物學(xué)樣品(如血液)篩選適體文庫(kù)??梢栽谥С治锷媳3诌m 體文庫(kù),并且生物學(xué)樣品通過適體。清除任何未結(jié)合的蛋白質(zhì),并且保留適體蛋白質(zhì)復(fù)合 物。自它們的蛋白質(zhì)宿主釋放保留的適體,并在下一代測(cè)序儀上測(cè)序和計(jì)數(shù)。可以使用下一代測(cè)序儀上適體的存在和數(shù)量、或者缺失來診斷特定疾病或困境 (predicament)。實(shí)施例6設(shè)計(jì)了一種新的寡核苷酸適體,使得該適體與所使用的下一代DNA測(cè)序技術(shù)平臺(tái) 相容。該適體具有如下的寡核苷酸序列,其具有三個(gè)獨(dú)特區(qū)a)功能性適體區(qū),b)銜接 頭區(qū),和C)標(biāo)記物。此研究中的適體區(qū)基于經(jīng)過充分研究的、對(duì)人免疫球蛋白E具有高親和力的適體 (Wiegand 等 Journal of Immunology(1996)157 221—230)。銜接頭區(qū)使得該構(gòu)建物與Illumina GAl下一代測(cè)序儀的樣品制備規(guī)程相容,而且 是依照制造商的方案設(shè)計(jì)的。標(biāo)記物是發(fā)熒光的6-羧基熒光素(FAM),包括它是為了容許顯現(xiàn)構(gòu)建物。構(gòu)建物通過標(biāo)準(zhǔn)固相DNA合成獲得,并通過聚丙烯酰胺凝膠電泳純化以確保低錯(cuò)誤率。帶FAM標(biāo)記物的構(gòu)建物在下文中稱作ProNuclF,而不帶標(biāo)記物的稱作ProNucl。構(gòu)建物用來證明i)此類適體衍生的單鏈寡核苷酸序列與用于下一代DNA序列應(yīng)用的樣品制備規(guī) 程相容;ii)使用Illumina GAl測(cè)序技術(shù)能對(duì)序列測(cè)序,即能找回(“讀取”)ProNucl的 身份;及iii)遵循標(biāo)準(zhǔn)Illumina GAl測(cè)序?qū)嶒?yàn),完整ProNucl序列的計(jì)數(shù)直接與摻入樣品 中的制備的ProNucl序列的數(shù)目關(guān)聯(lián),由此證實(shí)下一代測(cè)序能依照本發(fā)明應(yīng)用于蛋白質(zhì)組學(xué)。實(shí)施例7使用毛細(xì)管電泳(CE)來證實(shí)寡核苷酸序列展現(xiàn)獨(dú)特的蛋白質(zhì)親和力。試劑和溶液的制備如下自干的適體來源制備儲(chǔ)備IOOnM ProNucFl儲(chǔ)液,即在TGK緩沖液(三(羥基 氨基)甲烷-甘氨酸-鉀)緩沖液,PH 8.4)中稀釋DNA材料。稀釋后,將適體儲(chǔ)液于75°C 溫育10分鐘,隨后冷卻,并在冰中儲(chǔ)存以確保沒有多聚體。加熱規(guī)程還確保適體二級(jí)結(jié)構(gòu) 的形成。
自濃縮的5500nM蛋白質(zhì)儲(chǔ)液開始,在TGK緩沖液中制備IgE的稀釋系列(表1)表l:lgE稀釋系列
溶液_濃度(nM)
1 . 20 通過將5 μ 1的ProNucFl儲(chǔ)液與5 μ 1蛋白質(zhì)溶液一起溫育來制備展現(xiàn)適體-蛋 白質(zhì)復(fù)合物形成的CE樣品。以此方式為每個(gè)蛋白質(zhì)濃度水平制備總共六份復(fù)制品。將所 有樣品于室溫溫育最少30分鐘且不長(zhǎng)于40分鐘。設(shè)備分離是使用 Beckman P/ACE 2200 CE-LIF 系統(tǒng)(Beckman-Coulter,F(xiàn)ullerton, CA,USA)實(shí)現(xiàn)的。分離是使用熔融硅石毛細(xì)管(50 μ m ID,360ym0D)實(shí)施的,總長(zhǎng)40. 2cm, 檢測(cè)儀位于30cm。通過泵入IM NaOH、去離子吐0、和緩沖液穿過毛細(xì)管,每種10分鐘,預(yù) 處理毛細(xì)管。在每次電泳分離之間,用堿、水、和緩沖液再次沖洗毛細(xì)管以自毛細(xì)管壁清除 任何殘留樣品。使用Ipsi壓力注射樣品4s。LIF檢測(cè)器采用3mW Ar離子激光的488nm 線(Beckman-Coulter)進(jìn)行激發(fā),并經(jīng)由520士 IOnm濾光片收集發(fā)射。用P/ACE軟件 (Beckman-Coulter)記錄并分析數(shù)據(jù)。蛋白質(zhì)-適體結(jié)合以正常模式使用表2所述條件在柱上運(yùn)行每個(gè)蛋白質(zhì)濃度水平的樣品,首先確保 每份樣品溫育后確實(shí)形成了蛋白質(zhì)_適體復(fù)合物。表2:正常模式分離條件
操作_持續(xù)時(shí)間(S)_
沖洗20 psi —0.1 M NaOH120
沖洗20psi-緩沖液120注射Ipsi 4-樣品4 注射0.1 psi-水 1 分離 20kV 760
沖洗10 psi -緩沖液_60__結(jié)果作為例子,圖4顯示了含有150nM IgE和IOOnM ProNuclF的樣品的正常模式注射
14的層析圖。為了使適體-蛋白質(zhì)復(fù)合物形成適用定量目的,結(jié)合的適體級(jí)分必須反映蛋白質(zhì) 稀釋系列。為了證明這一點(diǎn),將恒定量的ProNuclF與不同蛋白質(zhì)濃度一起溫育(見上文)。自圖5可見,隨著蛋白質(zhì)濃度升高(底部記錄線“O”;上部記錄線5000nM),適 體-蛋白質(zhì)復(fù)合物的峰面積增大。同時(shí),游離ProNuclF的信號(hào)降低至檢測(cè)不到游離適體的 點(diǎn)(上部記錄線)。這顯示了向針對(duì)IgE的已知適體序列添加對(duì)下一代測(cè)序規(guī)程特異性的 銜接頭序列沒有削弱ProNuclF的適體能力-ProNuclF保持其對(duì)IgE的高和選擇性親和力。圖6顯示了轉(zhuǎn)換成圖的圖5信息,其中將“結(jié)合的ProNuclF級(jí)分”對(duì)蛋白質(zhì)濃度 繪圖。自此圖可見,ProNuclF適體能用于“讀取出”定量蛋白質(zhì)信息。自此(和其它)圖還 有可能推導(dǎo)平衡解離常數(shù)Kd,由其可得知ProNuclF對(duì)IgE的親和力,即76_92nM。實(shí)施例8進(jìn)行了實(shí)驗(yàn)來證明在前實(shí)施例中所例示的結(jié)合特征在定量背景中是適用的,即 蛋白質(zhì)濃度的差異與結(jié)合的適體(適體_蛋白質(zhì)復(fù)合物)級(jí)分相關(guān)。對(duì)這些適體-蛋白 質(zhì)復(fù)合物的選擇是依靠平衡混合物的不平衡毛細(xì)管電泳(NECEEM)來實(shí)現(xiàn)的,NECEEM是由 Krylov 等開發(fā)的(Journal of the American ChemicalSociety (2002) 124 13674-13675; Analytical Chemistry(2003)75 1382—1386)。方法開發(fā)了適應(yīng)樣品制備方案以容許對(duì)含有添加的測(cè)序序列的功能性IgE適體 (ProNucl)測(cè)序。圖7描繪了樣品制備方案中的不同步驟。測(cè)序引物位點(diǎn)1上引物1退火后,通過 用Taq聚合酶進(jìn)行的延伸形成雙鏈分子。將銜接頭連接至雙鏈分子,生成完整分子。此研究中所使用的IgE適體序列是在其3’端具有測(cè)序引物位點(diǎn)1的單鏈寡核苷 酸。為了制備互補(bǔ)鏈,使加尾(tailed)引物與引物1退火,并使用Taq聚合酶實(shí)施延伸。此反應(yīng)的配方為10 μ M Pronucl2μ 110 μ M 引物 15μ 12. 5mM dNTPs4μ 1IOx Taq聚合酶緩沖液5μ150mM MgCl22μ 1Taq 聚合酶0. 5 μ 1水31.5μ1將反應(yīng)物混合并加熱至94°C達(dá)2分鐘,接著受控冷卻至60°C并于72°C溫育10分 鐘。使用Qiagen MinElute柱按照制造商的說明清潔反應(yīng)產(chǎn)物,并在10 μ IEB緩沖液中洗 脫。通過加熱至94°C達(dá)2分鐘并受控冷卻至室溫,將100 μ M ProAdl和ProAd2銜接頭 溶液各20 μ 1在總體積50 μ 1 IOmM Tris-HCl ρΗ 8. 3中一起退火。ProAdl和ProAd2是自 Illumina GAl試劑盒得到的合成寡核苷酸。所使用的混合物為Ds 適體10 μ 1
2x DNA Illumina 連接酶緩沖液 25 μ 1 退火后的銜接頭寡聚物混合物 10 μ 1 Illumina DNA 連接酶 5 μ 1將反應(yīng)物混合并于室溫溫育15分鐘,之后在2%瓊脂糖中進(jìn)行凝膠電泳。自凝膠 切出適宜大小的條帶,提取DNA,并遵循標(biāo)準(zhǔn)Illumina富集PCR方案進(jìn)行擴(kuò)增。使用Agilent Bioanalyzer 2100對(duì)PCR擴(kuò)增子定量,并通過如下制備測(cè)序反應(yīng) 物將這些擴(kuò)增的適體添加至恒定量的PhiX,意圖產(chǎn)生表3給出的11 IuminaGAl簇?cái)?shù)目/格 (tile),以產(chǎn)生2x稀釋系列。第4道是沒有添加適體的PhiX,充當(dāng)對(duì)照道。為了避免懷疑,PhiX指雙鏈DNA PhiX174噬菌體的環(huán)狀基因組,其由5386個(gè)核苷 酸組成。在此研究中,依照Illumina GAl測(cè)序方案加工該基因組,充當(dāng)不同道中序列載荷 的標(biāo)準(zhǔn)化。準(zhǔn)備單末端流動(dòng)室(single end flowcell),并在Illumina GAl上按照制造商的 說明測(cè)序。表3 =Illumina GAl流動(dòng)室上八條不同道的每個(gè)格所使用的實(shí)際ProNucl和PhiX 序列數(shù)目。一條道由約300個(gè)格組成。 結(jié)果按照制造商的說明加工測(cè)序數(shù)據(jù)。對(duì)于數(shù)據(jù)分析,應(yīng)用不同策略來評(píng)估在不同道 中獲得的序列讀取a)對(duì)適體序列的精確匹配的搜索(Exact) ;b)容許多至3處擴(kuò)增/測(cè) 序錯(cuò)誤的搜索(Agi^p)。顯然也可以應(yīng)用其它加工方法。圖8描繪了在不同道中通過尋找 在不同道中找回的精確匹配/至多三處錯(cuò)誤的匹配,即精確適體序列計(jì)數(shù)和容錯(cuò)適體序列 計(jì)數(shù)(Agr印)而計(jì)數(shù)得到的IgE適體絕對(duì)數(shù)。X軸的數(shù)值對(duì)應(yīng)于第8道直至第1道的道讀 數(shù)(排除對(duì)照第4道;見表3)。相反,圖9相對(duì)于摻入PhiX序列混合物中的適體數(shù)目描繪了通過在獲得的全部序 列中尋找精確匹配而計(jì)數(shù)得到的IgE適體級(jí)分。在這兩種情況中都顯示了強(qiáng)線性相關(guān)性, 證實(shí)了下一代測(cè)序用于對(duì)適體定量的用途。上述數(shù)據(jù)顯示了,當(dāng)遵循標(biāo)準(zhǔn)Illumina GAl測(cè)序方案時(shí),全部ProNucl序列的計(jì) 數(shù)直接與摻入樣品中的制備的ProNucl序列的數(shù)目相關(guān),由此證實(shí)下一代測(cè)序能依照本發(fā)
明用于定量。
此外,數(shù)據(jù)顯示了所制備的ProNucl序列能使用下一代測(cè)序技術(shù)來測(cè)序。換言之, 能找回(“讀取”)ProNucl的身份。
權(quán)利要求
一種用于測(cè)量生物學(xué)樣品中至少一種分子的量的方法,該方法包括a)將所述樣品或其衍生物與一種或多種適體組合并容許所述樣品中的一種或多種分子結(jié)合至所述適體;b)將結(jié)合的分子與未結(jié)合的分子分開;并c)對(duì)結(jié)合至所述或每種適體的分子定量,其中對(duì)結(jié)合的分子的定量是通過對(duì)所述或每種適體的至少一部分測(cè)序來進(jìn)行的。
2.根據(jù)權(quán)利要求1的方法,其中所述至少一種分子是蛋白質(zhì)。
3.根據(jù)權(quán)利要求1或2的方法,其中所述分子的身份是已知的。
4.根據(jù)權(quán)利要求1或2的方法,其中所述分子的身份是未知的。
5.根據(jù)權(quán)利要求4的方法,其中該方法進(jìn)一步包括確定所述分子的身份。
6.根據(jù)權(quán)利要求1-4任一項(xiàng)的方法,其中所述或每種適體的序列是已知的。
7.根據(jù)權(quán)利要求1-6任一項(xiàng)的方法,其中每種適體序列攜帶獨(dú)特的標(biāo)簽。
8.根據(jù)權(quán)利要求7的方法,其中所述標(biāo)簽是所述適體的序列。
9.根據(jù)權(quán)利要求7或8的方法,其中所述標(biāo)簽是所述適體的序列的一部分。
10.根據(jù)權(quán)利要求1-9任一項(xiàng)的方法,其中測(cè)序是在單分子陣列或克隆單分子陣列上 進(jìn)行的。
11.根據(jù)權(quán)利要求1-10任一項(xiàng)的方法,其中該方法進(jìn)一步包括清除結(jié)合至所述或每種 分子的所述適體并將所述適體排列在表面上。
12.根據(jù)權(quán)利要求11的方法,其中該方法進(jìn)一步包括擴(kuò)增所排列的適體。
13.根據(jù)權(quán)利要求1-12任一項(xiàng)的方法,其中所述一種或多種適體包含結(jié)合相同分子的 不同序列。
14.根據(jù)權(quán)利要求1-12任一項(xiàng)的方法,其中所述一種或多種適體包含多組適體序列, 每組結(jié)合不同分子。
15.根據(jù)權(quán)利要求1-14任一項(xiàng)的方法,其中所述適體是自多核苷酸或多肽衍生的。
16.根據(jù)權(quán)利要求15的方法,其中所述適體是多核苷酸且具有約30個(gè)至約60個(gè)堿基。
17.根據(jù)權(quán)利要求16的方法,其中所述適體具有約40個(gè)堿基。
18.根據(jù)權(quán)利要求15的方法,其中所述適體是多肽且具有約30個(gè)至約60個(gè)氨基酸。
19.根據(jù)權(quán)利要求1-18任一項(xiàng)的方法,其中所述生物學(xué)樣品是體液。
20.根據(jù)權(quán)利要求19的方法,其中所述體液是血液或者是自血液衍生的。
21.根據(jù)權(quán)利要求20的方法,其中所述體液是血清或血漿。
22.根據(jù)權(quán)利要求1-21任一項(xiàng)的方法,其中該方法進(jìn)一步包括d)將第二生物學(xué)樣品與c)中獲得的定量的適體組合;e)將結(jié)合的分子與未結(jié)合的分子分開;f)對(duì)結(jié)合至適體的分子定量;并g)將c)中獲得的數(shù)量與f)中獲得的數(shù)量比較,其中對(duì)結(jié)合至第二樣品中一種或多種分子的適體的定量是通過對(duì)每種適體的至少一 部分測(cè)序來進(jìn)行的。
23.根據(jù)權(quán)利要求1-22任一項(xiàng)的方法,其中該方法進(jìn)一步包括將所述或每種適體的數(shù) 量與對(duì)照或基線數(shù)量比較。
24.根據(jù)權(quán)利要求22或23的方法,其中所述第二樣品是自已知處于疾病狀態(tài)的個(gè)體獲 得的。
25.根據(jù)權(quán)利要求22或23的方法,其中所述第二樣品是自已知處于健康狀態(tài)的個(gè)體獲 得的。
26.根據(jù)權(quán)利要求22或23的方法,其中所述第二樣品是自藥物治療后的個(gè)體獲得的。
27.權(quán)利要求1-26任一項(xiàng)的方法用于鑒定一種或多種生物標(biāo)志物的用途。
28.權(quán)利要求1-26任一項(xiàng)的方法用于驗(yàn)證一種或多種生物標(biāo)志物的用途。
29.權(quán)利要求1-21任一項(xiàng)的方法作為診斷方法的用途。
30.通過權(quán)利要求1-26任一項(xiàng)的方法鑒定的適體在診斷試劑盒中的用途。
31.以權(quán)利要求1-26任一項(xiàng)的方法使用的診斷試劑盒,其中該試劑盒包含一種或多種 適體。
32.根據(jù)權(quán)利要求31的診斷試劑盒,其中所述一種或多種適體是通過權(quán)利要求1-26任一項(xiàng)的方法鑒定的。
33.適體作為標(biāo)簽用于對(duì)樣品中的分子定量的用途,其中所述適體的序列的至少一部 分是所述標(biāo)簽。
34.根據(jù)權(quán)利要求33的用途,其中所述分子是蛋白質(zhì)。
35.根據(jù)權(quán)利要求33或34的用途,其中定量是通過對(duì)所述標(biāo)簽的至少一部分測(cè)序來進(jìn) 行的。
36.根據(jù)權(quán)利要求35的方法,其中測(cè)序是在單分子陣列或克隆單分子陣列上進(jìn)行的。
37.一種能夠測(cè)序的適體,其包括 適體序列;和至少一種銜接頭序列,其中所述銜接頭序列包含供所述適體附接于表面用來測(cè)序的附著序列。
38.根據(jù)權(quán)利要求37的適體,其中所述銜接頭序列進(jìn)一步包含測(cè)序引物。
39.根據(jù)權(quán)利要求37或38的適體,其中所述適體序列是DNA、RNA、PNA或其混合物。
40.根據(jù)權(quán)利要求37-39任一項(xiàng)的適體,其中該適體進(jìn)一步包括標(biāo)記物。
41.根據(jù)權(quán)利要求40的適體,其中所述標(biāo)記物是放射性標(biāo)記物或者是發(fā)熒光的。
42.根據(jù)權(quán)利要求41的適體,其中所述標(biāo)記物是6-羧基熒光素。
43.權(quán)利要求37-42任一項(xiàng)的適體在權(quán)利要求1-26任一項(xiàng)的方法或權(quán)利要求31或32 的診斷試劑盒中的用途。
全文摘要
本發(fā)明是用于測(cè)量生物學(xué)樣品中至少一種分子的量的方法,該方法包括a)將所述樣品或其衍生物與一種或多種適體組合并容許所述樣品中的一種或多種分子結(jié)合至所述適體;b)將結(jié)合的分子與未結(jié)合的分子分開;并c)對(duì)結(jié)合至所述或每種適體的所述分子定量,其中對(duì)結(jié)合的分子的定量是通過對(duì)所述或每種適體的至少一部分測(cè)序來進(jìn)行的。還涵蓋所述方法的用途和自所述方法衍生的產(chǎn)品。
文檔編號(hào)C12N15/115GK101896605SQ200880120684
公開日2010年11月24日 申請(qǐng)日期2008年10月10日 優(yōu)先權(quán)日2007年10月12日
發(fā)明者克萊夫·G·布朗, 凱恩·卡斯, 斯文·A·J·艾克曼 申請(qǐng)人:普羅諾塔股份有限公司