隨著重組DNA技術越來越多地被用于產生商業(yè)和工業(yè)用途的轉基因植物,這對開發(fā)分析轉基因植物系的高通量方法產生了需要。這樣的分析方法對于性狀發(fā)現(xiàn)研究、產品開發(fā)、種子生產和商業(yè)化是必需的,并且有助于具有期望的或最佳的表型的轉基因植物的快速開發(fā)。而且,目前用于人類消費的GM植物的安全性評估的建議指南要求在親本和轉化作物之間在DNA和蛋白質水平上進行表征。開發(fā)的新植物品種包括日益復雜的遺傳修飾,尤其是包括疊加的基因和性狀。
當前用于分析本領域優(yōu)選的轉基因植物的方法包括基于DNA的技術(例如PCR和/或RT-PCR);使用報告基因;Southern印跡;和免疫化學。所有這些方法都受限于各種缺點。
盡管之前已經公開了質譜,但現(xiàn)有方法由于缺乏有選擇性且靈敏的定量而受到限制。對用于植物中轉基因表達產物的定量的選擇性且靈敏的高通量方法仍然存在需要。
發(fā)明概述
本發(fā)明涉及使用質譜法對來自植物的復雜蛋白樣品進行定量多路分析的方法。在一些實施方案中,本公開涉及維持轉基因植物品種的方法,通過(例如)分析轉基因植物品種的多個世代而選擇性且靈敏地定量多重化的(multiplexed)轉基因蛋白。
在一個方面,提供了對基于植物的樣品中的一種或多種具有已知氨基酸序列的感興趣蛋白質進行定量的高通量方法。該方法包括:
(a)從基于植物的樣品中提取蛋白質;
(b)消化從步驟(a)提取的蛋白質獲得肽(peptides);
(c)在單一步驟中分離各肽;
(d)從具有已知氨基酸序列的感興趣蛋白質中確定多個特征肽;
(e)使用高分辨率精確質譜法(HRAM MS)測量所述多個特征肽;和
(f)基于所述特征肽的測量,定量所述具有已知氨基酸序列的感興趣蛋白質。
在一個實施方案中,通過柱色譜在單一步驟中分離各肽。在一個另外的實施方案中,柱色譜包括液相柱色譜。在另一個實施方案中,在單一步驟中獲得對應于感興趣蛋白質的各肽的質譜數據。
在一個實施方案中,所述一種或多種感興趣蛋白質包括兩種感興趣蛋白質。在另一個實施方案中,所述一種或多種感興趣蛋白質包括三種到二十種感興趣蛋白質。在另一個實施方案中,所述一種或多種感興趣蛋白質包括三種到十種感興趣蛋白質。在另一個實施方案中,所述一種或多種感興趣蛋白質包括四種感興趣蛋白質。
在一個實施方案中,所述基于植物的樣品來自轉基因植物。在一個另外的實施方案中,所述一種或多種感興趣蛋白質包括在轉基因植物中轉基因表達的預期產物。在另一個實施方案中,所述一種或多種感興趣蛋白質包括5'-烯醇丙酮酰-3'-磷酸莽草酸合酶(EPSPS)。在另一個實施方案中,所述一種或多種感興趣蛋白質包括5-烯醇丙酮酰莽草酸-3-磷酸合酶基因(2mEPSPS)。在另一個實施方案中,所述多個特征肽包含至少一個選自SEQ ID NO:2-25的序列。在另一個實施方案中,所述多個特征肽包含至少兩個選自SEQ ID NO:2-25的序列。在另一個實施方案中,所述多個特征肽包含至少三個選自SEQ ID NO:2-25的序列。在另一個實施方案中,所述多個特征肽包含SEQ ID NO:3、12、和21。在另一個實施方案中,所述多個特征肽由SEQ ID NO:3、12、和21組成。
在另一個實施方案中,所述一種或多種感興趣蛋白質包括芳氧基鏈烷酸酯雙加氧酶(AAD)。在另一個實施方案中,所述一種或多種感興趣蛋白質包括芳氧基鏈烷酸酯雙加氧酶-12(AAD-12)。在另一個實施方案中,所述多個特征肽包含至少一個選自SEQ ID NO:27-45的序列。在另一個實施方案中,所述多個特征肽包含至少兩個選自SEQ ID NO:27-45的序列。在另一個實施方案中,所述多個特征肽包含至少三個選自SEQ ID NO:27-45的序列。在另一個實施方案中,所述多個特征肽包含SEQ ID NO:28、29、和34。在另一個實施方案中,所述多個特征肽由SEQ ID NO:28、29、和34組成。
在另一個實施方案中,所述一種或多種感興趣蛋白質包括雙丙氨膦抗性(bar)基因產物或膦絲菌素N-乙酰轉移酶(PAT)。在另一個實施方案中,所述一種或多種感興趣蛋白質包括膦絲菌素乙酰轉移酶(PAT)。在另一個實施方案中,所述多個特征肽包含選自SEQ ID NO:47-60的至少一個序列。在另一個實施方案中,所述多個特征肽包含選自SEQ ID NO:47-60的至少兩個序列。在另一個實施方案中,所述多個特征肽包含選自SEQ ID NO:47-60的至少三個序列。在另一個實施方案中,所述多個特征肽包含SEQ ID NO:49、55、和56。在另一個實施方案中,所述多個特征肽由SEQ ID NO:49、55、和56組成。
在一個實施方案中,測量多個特征肽包括計算相應的峰高度或峰面積。在另一個實施方案中,測量多個特征肽包括比較來自高碎裂模式和低碎裂模式的數據。
在另一個方面,提供了對基于植物的樣品中一種或多種具有已知氨基酸序列的感興趣蛋白質進行定量的高通量系統(tǒng)。該系統(tǒng)包括:
用于從基于植物的樣品提取蛋白質的高通量手段/裝置;
用于在單一步驟中分離肽的分離模塊;
用于從具有已知氨基酸序列的感興趣蛋白質中選擇多個特征肽的選擇模塊;和
用于測量多個特征肽的高分辨率精確質譜(HRAM MS)。
在一個實施方案中,該分離模塊包括包括液相柱色譜。在另一個實施方案中,柱色譜包括液相柱色譜。在另一個實施方案中,高分辨率精確質譜(HRAM MS)包括串聯(lián)質譜儀。在另一個實施方案中,高分辨率精確質譜(HRAM MS)不包括串聯(lián)質譜儀。
在一個實施方案中,所述基于植物的樣品來自轉基因植物。在一個另外的實施方案中,所述一種或多種感興趣蛋白質包括在轉基因植物中轉基因表達的預期產物。在另一個實施方案中,所述一種或多種感興趣蛋白質包括5'-烯醇丙酮酰-3'-磷酸莽草酸合酶(EPSPS)。在另一個實施方案中,所述一種或多種感興趣蛋白質包括5-烯醇丙酮酰莽草酸-3-磷酸合酶基因(2mEPSPS)。在另一個實施方案中,所述多個特征肽包含至少一個選自SEQ ID NO:2-25的序列。在另一個實施方案中,所述多個特征肽包含至少兩個選自SEQ ID NO:2-25的序列。在另一個實施方案中,所述多個特征肽包含至少三個選自SEQ ID NO:2-25的序列。在另一個實施方案中,所述多個特征肽包含SEQ ID NO:3、12、和21。在另一個實施方案中,所述多個特征肽由SEQ ID NO:3、12、和21組成。
在另一個實施方案中,所述一種或多種感興趣蛋白質包括芳氧基鏈烷酸酯雙加氧酶(AAD)。在另一個實施方案中,所述一種或多種感興趣蛋白質包括芳氧基鏈烷酸酯雙加氧酶-12(AAD-12)。在另一個實施方案中,所述多個特征肽包含至少一個選自SEQ ID NO:27-45的序列。在另一個實施方案中,所述多個特征肽包含至少兩個選自SEQ ID NO:27-45的序列。在另一個實施方案中,所述多個特征肽至少三個包含選自SEQ ID NO:27-45的序列。在另一個實施方案中,所述多個特征肽包含SEQ ID NO:28、29、和34。在另一個實施方案中,所述多個特征肽由SEQ ID NO:28、29、和34組成。
在另一個實施方案中,所述一種或多種感興趣蛋白質包括雙丙氨膦抗性(bar)基因產物或膦絲菌素N-乙酰轉移酶(PAT)。在另一個實施方案中,所述一種或多種感興趣蛋白質包括膦絲菌素乙酰轉移酶(PAT)。在另一個實施方案中,所述多個特征肽包含至少一個選自SEQ ID NO:47-60的序列。在另一個實施方案中,所述多個特征肽包含至少兩個選自SEQ ID NO:47-60的序列。在另一個實施方案中,所述多個特征肽包含至少三個選自SEQ ID NO:47-60的序列。在另一個實施方案中,所述多個特征肽包含SEQ ID NO:49、55、和56。在另一個實施方案中,所述多個特征肽由SEQ ID NO:49、55、和56組成。
在另一個方面,提供了對基于植物的樣品中一種或多種具有已知氨基酸序列的感興趣蛋白質進行定量的高通量方法。該方法包括使用本文中提供的系統(tǒng)。
附圖簡述
圖1顯示本文中公開的方法和系統(tǒng)的代表性分析工作流程。
圖2顯示另一個來自HRAM LC-MS的標準色譜圖500ng/mL合成肽的代表性數據:總離子電流(上數第一圖);合并的提取離子(上數第二圖);提取離子367.2082m/z–EISGTVK(2+)(上數第三圖或中間圖);提取離子367.1850m/z-DVASWR(2+)(倒數第二圖);和提取離子484.7798m/z-VNGIGGLPGGK(2+)(倒數第一圖)。所有離子的提取窗口為2.0ppm。
圖3顯示來自HRAM LC-MS的胰蛋白酶消化的轉基因大豆樣品色譜圖的代表性數據:總離子電流(上數第一圖);合并的提取離子(上數第二圖);提取離子367.2082m/z–EISGTVK(2+)(上數第三圖或中間圖);提取離子367.1850m/z-DVASWR(2+)(倒數第二圖);和提取離子484.7798m/z-VNGIGGLPGGK(2+)(倒數第一圖)。所有離子的提取窗口為2.0ppm。
圖4顯示用于定量的具有肽注釋的疊加的HRAM LC-MS標準(上圖)和轉基因(下圖)提取離子色譜圖的代表性數據。所有離子的提取窗口為2.0ppm。
圖5顯示來自HRAM LC-MS的標準色譜圖500ng/mL合成肽的另外的代表性數據:總離子電流(上數第一圖);合并的提取離子(上數第二圖);提取離子346.6889m/z–FGAIER(2+)(上數第三圖或中間圖);提取離子621.8563m/z-IGGGDIVAISNVK(2+)(倒數第二圖);和提取離子598.2831m/z-AAYDALDEATR(2+)(倒數第一圖)。所有離子的提取窗口為2.0ppm。
圖6顯示來自HRAM LC-MS的胰蛋白酶消化的轉基因大豆樣品色譜圖的代表性數據:總離子電流(上數第一圖);合并的提取離子(上數第二圖);提取離子346.6889m/z–FGAIER(2+)(上數第三圖或中間圖);提取離子621.8563m/z-IGGGDIVAISNVK(2+)(倒數第二圖);和提取離子598.2831m/z-AAYDALDEATR(2+)(倒數第一圖)。所有離子的提取窗口為2.0ppm。
圖7顯示用于定量的具有肽注釋的疊加的HRAM LC-MS標準(上圖)和轉基因(下圖)提取離子色譜圖的代表性數據。所有離子的提取窗口為2.0ppm。
圖8顯示來自HRAM LC-MS的標準色譜圖500ng/mL合成肽的另外的代表性數據:總離子電流(上數第一圖);合并的提取離子(上數第二圖);提取離子928.9367m/z–TEPQTPQEWIDDLER(2+)(上數第三圖或中間圖);提取離子761.9330m/z-SVVAVIGLPNDPSVR(2+)(倒數第二圖);和提取離子565.8013m/z-LHEALGYTAR(2+)(倒數第一圖)。所有離子的提取窗口為2.0ppm。
圖9顯示來自HRAM LC-MS的胰蛋白酶消化的轉基因大豆樣品色譜圖的代表性數據:總離子電流(上數第一圖);合并的提取離子(上數第二圖);提取離子928.9367m/z–TEPQTPQEWIDDLER(2+)(上數第三圖或中間圖);提取離子761.9330m/z-SVVAVIGLPNDPSVR(2+)(倒數第二圖);和提取離子565.8013m/z-LHEALGYTAR(2+)(倒數第一圖)。所有離子的提取窗口為2.0ppm。
圖10顯示用于定量的具有肽注釋的疊加的HRAM LC-MS標準(上圖)和轉基因(下圖)提取離子色譜圖的代表性數據。所有離子的提取窗口為2.0ppm。
發(fā)明詳述
本發(fā)明基于這樣的發(fā)現(xiàn),即在利用特定儀器的多路分析過程中,來自前體蛋白的選定的特征肽可以產生靈敏的定量。具體地,在一個實施方案中,液相色譜與高分辨率精確質譜(LC-HRAM MS)方法聯(lián)用檢測5-烯醇丙酮酰莽草酸-3-磷酸合酶(2mEPSPS)的蛋白表達水平。本文中公開的方法和系統(tǒng)能夠分析單獨的2mEPSPS,或用于植物提取物中2mEPSPS與另外的蛋白質的組合的定量分析多路測定。具體地,在另一個實施方案中,液相色譜與高分辨率精確質譜(LC-HRAM MS)方法聯(lián)用檢測芳氧基鏈烷酸酯雙加氧酶-12(AAD-12)的蛋白表達水平。本文中公開的方法和系統(tǒng)能夠分析單獨的AAD-12,或用于植物提取物中AAD-12與另外的蛋白質的組合的定量分析多路測定。具體地,在又另一個實施方案中,液相色譜與高分辨率精確質譜(LC-HRAM MS)方法偶聯(lián)檢測膦絲菌素乙酰轉移酶(PAT)的蛋白表達水平。本文中公開的方法和系統(tǒng)能夠分析單獨的PAT,或用于植物提取物中PAT與另外的蛋白質的組合的定量分析多路測定。
由于越來越多的轉基因蛋白被共表達或“疊加”以實現(xiàn)對多種除草劑的耐受性或提供多種抗蟲作用方式,靈敏的、能夠選擇性地檢測多種感興趣的轉基因蛋白多路測定具有重要意義。目前,用于轉基因蛋白表達檢測的所有相關技術嚴重依賴于傳統(tǒng)的免疫化學技術,這對于容納產生每個樣品所需的數據量提出了挑戰(zhàn)。
通常使用選擇反應監(jiān)測(SRM)來完成用于定量研究的質譜檢測。使用特定類型的儀器,進行對來源中形成的感興趣離子的初始質量選擇,隨后在質譜儀(MS)的碰撞區(qū)域中解離該前體(蛋白質)離子,然后對特定的產物(肽)離子進行質量選擇和計數。在一些實施方案中,單位時間計數(counts per unit time)可以提供可積分的峰面積,從中可以確定分析物的量或濃度。在一些實施方案中,在具有HRAM能力的質譜儀上進行用于定量的高分辨率精確質量(HRAM)監(jiān)測的使用可以包括,但不限于:混合四極-飛行時間、四極-軌道阱、離子阱-軌道阱或四極-離子阱-軌道阱(三合一)質譜儀。通過使用特定類型的儀器,肽不經歷碎裂條件,而是作為完整的肽通過使用全掃描或靶向掃描模式(例如,選擇性離子監(jiān)測模式或SIM)加以測量??赏ㄟ^產生每種特定分析物的提取離子色譜圖來確定可積分的峰面積,并且可以計算分析物的量或濃度。數據的高分辨率和精確質量性質使得感興趣的分析物(蛋白質和/或肽)的高度特異性和靈敏的離子信號成為可能。
除非另有說明,在包括說明書和權利要求書在內的本申請中使用的以下術語具有下面給出的定義。必須注意的是,如在說明書和在所附權利要求中使用的,單數形式“一個(a)”、“一種(an)”以及“該”包括復數指示物,除非上下文中另外清楚地指出。
如本文中所用的,術語“生物限制”是指遺傳修飾的植物或其遺傳物質移動到指定區(qū)域的限制。該術語包括物理、物理化學、生物限制,以及阻止遺傳修飾的植物在自然環(huán)境或人工生長條件下的存活、擴散或繁殖的其他形式的限制。
如本文中使用的,術語“復雜蛋白樣品”用于區(qū)分樣品與純化的蛋白樣品。復雜蛋白樣品含有多種蛋白質,并可能另外含有其他污染物。
如本文中使用的,通用術語“質譜”或“MS”是指任何適合的質譜方法、裝置或配置,包括例如電噴霧電離(ESI)、基質輔助激光解吸/電離(MALDI)MS、MALDI-飛行時間(TOF)MS、大氣壓(AP)MALDI MS、真空MALDI MS、或其組合。質譜裝置通過測量分子經過一組磁場和電場的飛行路徑來測量所述分子的分子質量(作為分子的質荷比的函數)。質荷比是在帶電粒子的電動力學中廣泛使用的物理量??梢杂杀绢I域技術人員先驗地計算特定肽的質荷比。兩個具有不同質荷比的粒子當經受相同的電場和磁場時在真空中不會以相同的路徑移動。
質譜儀器由三個模塊組成:離子源,其將樣品分子分離成離子;質量分析器,其通過施加電磁場根據離子的質量來將它們分類;和檢測器,其測量指示劑量的值,并由此提供用于計算每個離子存在的豐度的數據。該技術既可以應用于定性也可以應用于定量。這些應用包括鑒定未知化合物,確定分子中元素的同位素組成,通過觀察化合物的碎裂來確定它的結構,以及定量樣品中化合物的量。
質譜方法和裝置的詳細綜述可以在通過提述并入本文的以下參考文獻中找到:Can和Annan(1997)Overview of peptide and protein analysis by mass spectrometry.In:Current Protocols in Molecular Biology,由Ausubel等人編輯,New York:Wiley,p.10.21.1-10.21.27;Paterson和Aebersold(1995)Electrophoresis 16:1791-1814;Patterson(1998)Protein identification and characterization by mass spectrometry.In:Current Protocols in Molecular Biology,Ausubel等人編輯,New York:Wiley,p.10.22.1-10.22.24;以及Domon和Aebersold(2006)Science 312(5771):212-17。
如該術語本文中使用的,當同一樣品中存在兩種或更多種感興趣的蛋白質和/或肽時,蛋白質和/或肽是“多路(化)的”。
如本文中使用的,“植物性狀”可以指植物的任何單一特征或可量化的測量。
如本文中使用的,短語“肽”或“肽類”可以指以確定的順序連接α-氨基酸所形成的短聚合物。也可以通過用蛋白酶消化多肽(例如蛋白質)產生肽。
如本文中使用的,短語“蛋白質”或“蛋白質”可以指由排列在直鏈中并通過相鄰氨基酸殘基的羧基和氨基之間的肽鍵連接在一起的氨基酸構成的有機化合物。蛋白質中的氨基酸序列由遺傳密碼中編碼的基因序列定義。通常,遺傳密碼指定20個標準氨基酸,然而在某些生物中,遺傳密碼可包括硒代半胱氨酸—并且在某些古細菌中包括-吡咯賴氨酸。常常觀察到蛋白質中的殘基通過翻譯后修飾而被化學修飾,所述修飾可以在蛋白質在細胞中被利用之前或作為調控機制的一部分發(fā)生。蛋白質殘基也可以根據本領域技術人員熟悉的技術通過設計加以修飾。如本文中使用的,術語“蛋白質”包括包含天然存在的氨基酸、合成氨基酸、修飾的氨基酸、或任何或所有上述氨基酸的組合的線性鏈。
如本文中使用的,術語“單次注射”是指在MS或LC-MS裝置操作中的初始步驟。當蛋白質樣品在單次注射中引入裝置中時,整個樣品是在單一步驟中引入的。
如本文中使用的,短語“特征肽”是指特定蛋白質的鑒別(短肽)序列。任何蛋白質可以含有平均10至100個特征肽。特征肽一般具有以下標準中的至少一個:容易通過質譜法檢測,可預測地和穩(wěn)定地從液相色譜(LC)柱洗脫,通過反相高效液相色譜(RP-HPLC)富集,電離良好,碎裂良好,或其組合。通過質譜法易于定量的肽一般具有以下標準中的至少一個:易于合成,能夠被高度純化(>97%),可溶于≤20%乙腈,非特異性結合低,抗氧化,合成后抗修飾,以及疏水性或疏水性指數≥10且≤40。疏水性指數可以根據Krokhin,Molecular and Cellular Proteomics 3(2004)908計算,將此文獻通過提述并入本文。已知具有疏水性指數小于10或大于40的肽可能無法通過RP-HPLC柱可重現(xiàn)地拆分或洗脫。
如本文中使用的,術語“疊加”是指摻入植物基因組中的多個異源多核苷酸的存在。
串聯(lián)質譜:在串聯(lián)質譜法中,從感興趣的分子產生的母離子(parent ion)可以在質譜儀中過濾,并且母離子隨后被碎裂以產生一個或多個子離子(daughter ion),然后在第二質譜程序中分析(檢測和/或定量)所述子離子。在一些實施方案中,排除使用串聯(lián)質譜法。在這些實施方案中,在所提供的方法和系統(tǒng)中不使用串聯(lián)質譜法。因此,在這些實施方案中既不產生母離子也不產生子離子。
如本文中使用的,術語“轉基因植物”包括在其基因組內包含異源多核苷酸的植物。通常,異源多核苷酸穩(wěn)定整合在基因組內,使得多核苷酸傳代到連續(xù)世代。異源多核苷酸可以單獨地或作為重組表達盒的一部分整合到基因組中?!稗D基因”在本文中用于包括其基因型由于異源核酸的存在已經被改變的任何細胞、細胞系、愈傷組織、組織、植物部分或植物,包括最初如此改變以及通過有性雜交或無性繁殖從初始轉基因植物產生的那些轉基因植物。
在本發(fā)明的實踐中可以處理提供有用植物部分的任何植物。實例包括提供花、果實、蔬菜和籽粒的植物。
如本文中使用的,用語“植物”包括雙子葉植物和單子葉植物。雙子葉植物的實例包括煙草、擬南芥、大豆、番茄、木瓜、蕓苔、向日葵、棉花、苜蓿、馬鈴薯、葡萄樹、木豆、豌豆、蕓苔屬植物、鷹嘴豆、糖用甜菜、油菜、西瓜、甜瓜、胡椒、花生、南瓜(pumpkin)、蘿卜、菠菜、倭瓜(squash)、綠花椰菜、卷心菜、胡蘿卜、花椰菜、芹菜、大白菜、黃瓜、茄子、和萵苣。單子葉植物的實例包括玉米、水稻、小麥、甘蔗、大麥、黑麥、高粱、蘭花、竹子、香蕉、香蒲、百合、燕麥、洋蔥、小米、和黑小麥。果實的實例包括香蕉、菠蘿、桔子、葡萄、葡萄柚、西瓜、甜瓜、蘋果、桃、梨、獼猴桃、芒果、油桃、番石榴、柿子、鱷梨、檸檬、無花果、和漿果?;ǖ陌▽嵗凉M天星(baby’s breath)、康乃馨、大麗花、水仙、天竺葵、非洲菊、百合、蘭花、牡丹、野胡蘿卜花(Queen Anne's lace)、玫瑰、金魚草、或其他插花(cut-flowers)或裝飾花、盆花和花球。
在質譜方法中從復雜樣品中鑒定單個蛋白質所容許的特異性是獨特的,因為僅需要感興趣的蛋白質序列即可鑒定感興趣的蛋白質。與其他形式的多路復用相比,質譜法的獨特之處在于其能夠利用蛋白質的一級氨基酸序列的全長來靶向蛋白質的一級氨基酸序列中獨特的標識類型部分(identifier-type portions),從而幾乎消除非特異性檢測。在本發(fā)明的一些實施方案中,利用獨特地標識感興趣的蛋白質的蛋白水解片段或蛋白水解片段組來檢測復雜蛋白樣品中的感興趣的蛋白質。
在一些實施方案中,所公開的方法能夠通過單次質譜分析來定量或測定復雜蛋白樣品中多種蛋白質的比率,而不是單獨多次測量每一種感興趣的蛋白質并將各個結果編譯成一個樣品結果。
在一些實施方案中,本公開內容還提供了可用于開發(fā)和使用轉基因植物技術的方法。具體地,公開的方法可以用于在連續(xù)世代中維持轉基因植物的基因型。同樣,本文中公開的方法的一些實施方案可用于提供非轉基因植物的高通量分析,所述非轉基因植物有被來自相鄰植物的轉基因污染(例如通過異花授粉)的風險。通過這些實施方案,可以促進和/或實現(xiàn)轉基因的生物限制。在其他實施方案中,本文中公開的方法可以用于以高通量方式篩選植物轉化程序的結果,以鑒定表現(xiàn)出期望的表達特征的轉化體。
可以使用本發(fā)明的方法分析經由轉基因表達技術引入植物中的任何蛋白質。適合于根據本發(fā)明的多路分析的蛋白質可以賦予使轉基因植物優(yōu)于其非轉基因對應物的輸出性狀??梢再x予的期望性狀的非限制性實例包括除草劑抗性、對昆蟲的抗性、對疾病的抗性、對環(huán)境脅迫的抗性、增加的產量、改善的營養(yǎng)價值、改善的保質期、改變的油含量、改變的油組成、改變的糖含量、改變的淀粉含量、基于植物的藥物的生產、工業(yè)產品(例如聚羥基鏈烷酸酯:被認為是理想的替代石油衍生的塑料的大分子聚酯)的生產、以及生物修復的潛力。而且,可以使用本公開的方法分析單個植物物種內的一種或多種轉基因蛋白的表達。將兩個或更多個基因或期望性狀添加或調節(jié)到單個感興趣物種中稱為基因疊加。此外,在目前公開的具有一種或多種內源植物蛋白的多路分析中,可以同時分析一種或多種轉基因蛋白的表達。
在轉基因植物中表達的特別適合的蛋白質是賦予除草劑耐受性的那些,例如賦予對草甘膦除草劑的耐受性的5'-烯醇丙酮酰-3'-磷酸莽草酸合酶(EPSPS)的基因或其任何變體、賦予對2,4-D除草劑的耐受性的芳氧基鏈烷酸酯加雙氧酶(AAD)、賦予對草銨膦除草劑的耐受性的膦絲菌素乙酰轉移酶(PAT)、或其組合。
可以使用四極桿分析器來確定質荷比。例如,在“四極桿”或“四極桿離子阱”儀器中,振蕩射頻場中的離子受到與施加在電極之間的DC電勢、RF信號的振幅和m/z成比例的力。可以選擇電壓和振幅,使得只有具有特定m/z的離子才能行遍四極桿的全長,而所有其他離子被偏轉。因此,四極桿儀器可以充當注入儀器中的離子的“質量過濾器”和“質量檢測器”。
碰撞誘導解離(“CID”)通常用于產生供進一步檢測的子離子。在CID中,母離子通過與惰性氣體如氬氣碰撞而獲得能量,隨后通過稱為“單分子分解”的過程而碎裂。母離子中必須儲存足夠的能量,使得離子內的某些鍵可以由于增加的能量而斷裂。
質譜儀一般向用戶提供離子掃描;即,在給定范圍(例如10至1200amu)內每個m/z的相對豐度。分析物測定的結果,即質譜,可以通過本領域已知的許多方法與原始樣品中的分析物的量關聯(lián)。例如,鑒于取樣和分析參數是得到仔細控制的,可以將給定離子的相對豐度與該相對豐度到原始分子的絕對量的換算表進行比較?;蛘?,可以與樣品一起運行分子標準品(例如,內標和外標),并基于從那些標準品產生的離子構建標準曲線。使用這種標準曲線,給定離子的相對豐度可以轉化為原始分子的絕對量。許多其他用于將離子的存在或量與原始分子的存在或量關聯(lián)的方法是本領域普通技術人員熟知的。
電離方法的選擇可以基于待測量的分析物、樣品類型、檢測器類型、陽性對陰性模式的選擇等來確定??梢允褂枚喾N方法產生離子,所述方法包括但不限于:電子電離、化學電離、快速原子轟擊、場解吸、和基質輔助激光解吸電離(MALDI)、表面增強激光解吸電離(SELDI)、解吸電噴霧電離(DESI)、光子電離、電噴霧電離、和電感耦合等離子體。電噴霧電離是指其中將溶液通過一段末端施加有高的正或負電位的短毛細管的方法。到達管端部的溶液被蒸發(fā)(霧化)成在溶劑蒸氣中的非常小的溶液液滴的射流或噴霧。這種液滴的霧流過蒸發(fā)室,蒸發(fā)室被加熱以防止冷凝并使溶劑蒸發(fā)。隨著液滴變小,電表面電荷密度增加,直到這樣的時間為止:在相同電荷之間的自然排斥導致離子以及中性分子被釋放。
LC的流出物可以直接且自動地(即,“在線”)注入到電噴霧裝置中。在一些實施方案中,LC流出物中包含的蛋白質首先通過電噴霧電離成母離子。
各種不同的質量分析器可用于液相色譜-質譜聯(lián)用(LC-MS)。示例性質量分析器包括但不限于單四極桿、三重四極桿、離子阱、TOF(飛行時間)、和四極桿飛行時間(Q-TOF)。
四極桿質量分析器可以由4個彼此平行設置的圓棒組成。在四極桿質譜儀(QMS)中,四極桿是負責基于離子的質荷比(m/z)過濾樣品離子的儀器組件?;陔x子在施加到桿的振蕩電場中的軌跡的穩(wěn)定性,離子在四極桿中被分離。
離子阱是捕獲真空系統(tǒng)或管的區(qū)域中的離子的電場或磁場的組合。離子阱可以在質譜中使用,同時操縱離子的量子態(tài)。
飛行時間質譜法(TOFMS)是質譜法的一種方法,其中通過時間測量來確定離子的質荷比。離子被已知強度的電場加速。該加速產生與具有相同電荷的任何其他離子具有相同動能的離子。離子的速度取決于質荷比。測量粒子隨后到達在已知距離處的檢測器所花費的時間。這一時間將取決于粒子的質荷比(粒子越重,到達的速度越低)。根據這一時間和已知的實驗參數,可以找到離子的質荷比。
在一些實例中,通過所提供的方法和/或系統(tǒng)使用的特定儀器可以包括高碎裂模式和低碎裂模式(或可替代地非碎裂模式)。這樣的不同模式可以包括產生高分辨率質量數據的交替掃描高能量和低能量獲取方法。在一些實施方案中,高分辨率質量數據可以包括產物數據集(例如,在高碎裂模式下從產物離子(碎裂離子)衍生的數據)和前體數據集(例如,在低碎裂或非碎裂模式下從前體離子(未碎裂離子)衍生的數據)。
在一些實施方案中,所提供的方法和/或系統(tǒng)使用質譜儀,所述質譜儀包括可用于選擇步驟的過濾裝置、可用于碎裂步驟的碎裂裝置、和/或用于獲取和/或質譜創(chuàng)建步驟中的一個或多個質量分析器。
過濾裝置和/或質量分析器可以包括四極桿。選擇步驟和/或獲取步驟和/或質譜創(chuàng)建步驟可涉及分辨四極桿(resolving quadrupole)的使用。另外或可替代地,過濾裝置可包括二維或三維離子阱或飛行時間(ToF)質量分析器。該/這些質量分析器可以包括或進一步包括下述的一者或多者:飛行時間質量分析器和/或離子回旋共振質量分析器和/或軌道阱質量分析器和/或二維或三維離子阱。
借助基于質荷比(m/z)的選擇的過濾可以如下實現(xiàn):使用可以基于m/z選擇離子的質量分析器(例如四極桿);或傳輸寬的m/z范圍,根據離子的m/z分離離子,然后借助于離子的m/z值選擇感興趣的離子。后者的實例是與定時離子選擇器組合的飛行時間質量分析器。所提供的方法和/或系統(tǒng)可以包括使用色譜技術,例如液相色譜(LC),分離和/或分開一種或多種感興趣的蛋白質,例如從多種蛋白質的兩種或更多種蛋白質中。該方法可以進一步包括測量感興趣的蛋白質的洗脫時間和/或將測量的洗脫時間與預期的洗脫時間進行比較。
另外或可替代地,可以使用離子遷移技術分離感興趣的蛋白質,這可以使用離子遷移單元來進行。另外,可以通過離子遷移漂移的次序或時間來選擇感興趣的蛋白質。該方法可以進一步包括測量感興趣的蛋白質的漂移時間和/或將測量的漂移時間與預期的漂移時間進行比較。
在一些實施方案中,所提供的方法和/或系統(tǒng)是無標記的,其中定量可以通過比較在注射之間或跨樣品的感興趣前體或產物m/z值的峰強度或質譜峰下面積來實現(xiàn)。在一些實施方案中,內標標準化可用于解決任何已知的相關分析誤差。另一種無標記的定量方法——光譜計數(spectral counting),涉及以非冗余或冗余方式對每個給定肽獲得的碎片離子譜或掃描的數目求和。然后將每種蛋白質的各相關肽質譜圖加和,從而提供每種蛋白質的掃描數量的測量,其與蛋白質的豐度成比例。然后可以在樣品/注射之間進行比較。
在一些實施方案中,離子源選自:(1)電噴霧電離(“ESI”)離子源;(2)大氣壓光電離(“APPI”)離子源;(3)大氣壓化學電離(“APCI”)離子源;(4)基質輔助激光解吸電離(“MALDI”)離子源;(5)激光解吸電離(“LDI”)離子源;(6)大氣壓電離(“API”)離子源;(7)硅上解吸電離(“DIOS”)離子源;(8)電子轟擊(“E1”)離子源;(9)化學電離(“CI”)離子源;(10)場電離(“F1”)離子源;(11)場解吸(“FD”)離子源;(12)電感耦合等離子體(“ICP”)離子源;(13)快速原子轟擊(“FAB”)離子源;(14)液體二次離子質譜(“LSIMS”)離子源;(15)解吸電噴霧電離(“DESI”)離子源;(16)鎳-63放射性離子源;(17)大氣壓基質輔助激光解吸電離離子源;和(18)熱噴霧離子源。
在一些實施方案中,所提供的方法和/或系統(tǒng)包括被配置為執(zhí)行包括計算機可讀程序代碼手段的計算機程序元件的設備和/或控制系統(tǒng),所述計算機可讀程序代碼手段用于使處理器執(zhí)行用于實現(xiàn)所述方法的過程。
在一些實施方案中,所提供的方法和/或系統(tǒng)使用交替的低和高能量掃描功能,與植物提取物的液相色譜分離聯(lián)用。可以提供感興趣的蛋白質的信息列表,包括但不限于前體離子的mm/z、產物離子的m/z、保留時間、離子遷移漂移時間和遷移變化率。在LC分離過程中,并且當靶離子洗脫到質譜儀中時(并且由于檢測到低能量前體離子或高能量產物離子,或者激活保留時間窗),所提供的方法和/或系統(tǒng)的質量分析器可以選擇窄的m/z范圍(寬度可變),以便將離子傳遞到氣體池。因此,可以顯著增強信噪比將感興趣的蛋白質加以定量。
在一些實施方案中,在感興趣的靶蛋白即將洗脫進入質譜儀離子源的色譜保留時間,所提供的方法和/或系統(tǒng)的質量分析器可以根據靶向的前體離子選擇窄的m/z范圍(寬度可變)。然后將這些選擇的離子轉移到能夠通過在高碎裂模式和低碎裂模式(或非碎裂模式)之間交替和重復切換來離解離子的儀器階段,其中在高碎裂模式下樣品前體離子基本上被碎裂成產物離子,其中在低碎裂模式下樣品前體離子基本上不碎裂。一般在兩種模式下都獲得高分辨率精確質譜,并且在實驗結束時,通過離子的色譜洗脫時間和任選的其他物理化學性質的擬合的緊密程度來識別相關的前體離子和產物離子。與感興趣的靶蛋白相關的前體離子或產物離子的信號強度可用于確定植物提取物中蛋白質的量。
本領域技術人員將理解,可以存在基于所提供的公開內容的某些變化。因此,給出以下實施例用于說明本發(fā)明的目的,而不應解釋為對本發(fā)明或權利要求的范圍的限制。
實施例
實施例1
用混有二硫蘇糖醇(DTT)的測定緩沖液PBST提取植物樣品(例如籽粒、葉、根、草料、花粉)。SEQ ID NO:1提供了5-烯醇丙酮酰莽草酸-3-磷酸合酶(2mEPSPS)的蛋白質序列:
MAGAEEIVLQPIKEISGTVKLPGSKSLSNRILLLAALSEGTTVVDNLLNSEDVHYMLGALRTLGLSVEADKAAKRAVVVGCGGKFPVEDAKEEVQLFLGNAGIAMRSLTAAVTAAGGNATYVLDGVPRMRERPIGDLVVGLKQLGADVDCFLGTDCPPVRVNGIGGLPGGKVKLSGSISSQYLSALLMAAPLALGDVEIEIIDKLISIPYVEMTLRLMERFGVKAEHSDSWDRFYIKGGQKYKSPKNAYVEGDASSASYFLAGAAITGGTVTVEGCGTTSLQGDVKFAEVLEMMGAKVTWTETSVTVTGPPREPFGRKHLKAIDVNMNKMPDVAMTLAVVALFADGPTAIRDVASWRVKETERMVAIRTELTKLGASVEEGPDYCIITPPEKLNVTAIDTYDDHRMAMAF SLAACAEVPVTIRDPGCTRKTFPDYFDVLSTFVKN.
將提取的蛋白質變性,然后通過加入胰蛋白酶蛋白酶并在37℃下溫育15-20小時進行蛋白水解消化。然后將消化反應物用甲酸(pH=1-2)酸化,并使用LC-MS進行分析。在計算機上分析和消化2mEPSPS的蛋白質序列以產生待檢測的理論肽片段并通過LC-MS進行測量。胰蛋白酶消化后的5-烯醇丙酮酰莽草酸-3-磷酸合酶(2mEPSPS)的候選特征肽列于表1中。
令人驚訝的是,與來自酶聯(lián)免疫吸附測定(ELISA)或其他定量方法的結果相比,使用LC-MS進行定量,三個候選特征肽提供了良好的相關性。這三個特征肽是EISGTVK(SEQ ID NO:3)、DVASWR(SEQ ID NO:21)、和VNGIGGLPGGK(SEQ ID NO:12)。,這些序列的商業(yè)合成肽以及微生物衍生的2mEPSPS蛋白都用作分析參考標準品經歷與上述相同的消化過程,其中合成肽可以直接用作蛋白質定量的分析參考標準品。
來自HRAM LC-MS的標準色譜圖500ng/mL合成肽的代表性數據顯示在圖2中,其中在總離子電流(上數第一圖);合并的提取離子(上數第二圖);提取離子367.2082m/z–EISGTVK(2+)(上數第三圖或中間圖);提取離子367.1850m/z-DVASWR(2+)(倒數第二圖);和提取離子484.7798m/z-VNGIGGLPGGK(2+)(倒數第一圖)中進行比較可以鑒定每個特征肽的特征峰。所有離子的提取窗口為2.0ppm。
來自HRAM LC-MS的的胰蛋白酶消化的轉基因大豆樣品色譜圖另外的代表性數據顯示在圖3中,其中在總離子電流(上數第一圖);合并的提取離子(上數第二圖);提取離子367.2082m/z–EISGTVK(2+)(上數第三圖或中間圖);提取離子367.1850m/z-DVASWR(2+)(倒數第二圖);和提取離子484.7798m/z-VNGIGGLPGGK(2+)(倒數第一圖)中進行比較也可以鑒定每個特征肽的特征峰。所有離子的提取窗口為2.0ppm。
可以計算每個特征肽的特征峰的峰面積,并且具有肽注釋的疊加的HRAM LC-MS標準(上圖)和轉基因(下圖)提取的離子色譜圖的代表性數據顯示在圖4中用于定量。所有離子的提取窗口為2.0ppm。
實施例2
用混有二硫蘇糖醇(DTT)的測定緩沖液PBST提取植物樣品(例如籽粒、葉、根、草料、花粉)。將提取的蛋白質變性,然后通過加入胰蛋白酶蛋白酶并在37℃下溫育15-20小時進行蛋白水解消化。然后將消化反應用甲酸(pH=1-2)酸化,并使用LC-MS進行分析。SEQ ID NO:26提供了AAD-12蛋白序列:
MAQTTLQITPTGATLGATVTGVHLATLDDAGFAALHAAWLQHALLIFPGQHLSNDQQITFAKRFGAIERIGGGDIVAISNVKADGTVRQHSPAEWDDMMKVIVGNMAWHADSTYMPVMAQGAVFSAEVVPAVGGRTCFADMRAAYDALDEATRALVHQRSARHSLVYSQSKLGHVQQAGSAYIGYGMDTTATPLRPLVKVHPETGRPSLLIGRHAHAIPGMDAAESERFLEGLVDWACQAPRVHAHQWAAGDVVVWDNRCLLHRAEPWDFKLPRVMWHSRLAGRPETEGAALV.
在計算機上分析和消化AAD-12的蛋白質序列以產生待檢測的理論肽片段并通過LC-MS進行測量。胰蛋白酶消化后的AAD-12的候選特征肽列于表2中。
令人驚訝的是,與來自酶聯(lián)免疫吸附測定(ELISA)或其他定量方法的結果相比,使用LC-MS進行定量,三個候選特征肽提供了良好的相關性。這三個特征肽是FGAIER(SEQ ID NO:28)、IGGGDIVAISNVK(SEQ ID NO:29)、和AAYDALDEATR(SEQ ID NO:34)。通過與上述相同的消化過程,這些序列的商業(yè)合成肽以及微生物衍生的AAD-12蛋白都用作分析參考標準品,其中合成肽可以直接用作蛋白質定量的分析參考標準品。
來自HRAM LC-MS的標準色譜圖500ng/mL合成肽的代表性數據顯示在圖5中,其中在總離子電流(上數第一圖);合并的提取離子(上數第二圖);提取離子346.6889m/z–FGAIER(2+)(上數第三圖或中間圖);提取離子621.8563m/z-IGGGDIVAISNVK(2+)(倒數第二圖);和提取離子598.2831m/z-AAYDALDEATR(2+)(倒數第一圖)中進行比較可以鑒定每個特征肽的特征峰。所有離子的提取窗口為2.0ppm。
來自HRAM LC-MS的的胰蛋白酶消化的轉基因大豆樣品色譜圖另外的代表性數據顯示在圖6中,其中在總離子電流(上數第一圖);合并的提取離子(上數第二圖);提取離子346.6889m/z–FGAIER(2+)(上數第三圖或中間圖);提取離子621.8563m/z-IGGGDIVAISNVK(2+)(倒數第二圖);和提取離子598.2831m/z-AAYDALDEATR(2+)(倒數第一圖)中進行比較也可以鑒定每個特征肽的特征峰。所有離子的提取窗口為2.0ppm。
可以計算每個特征肽的特征峰的峰面積,并且具有肽注釋的疊加的HRAM LC-MS標準(上圖)和轉基因(下圖)提取的離子色譜圖的代表性數據顯示在圖7中用于定量。所有離子的提取窗口為2.0ppm。
實施例3
用混有二硫蘇糖醇(DTT)的測定緩沖液PBST提取植物樣品(例如籽粒、葉、根、草料、花粉)。將提取的蛋白質變性,然后通過加入胰蛋白酶蛋白酶并在37℃下溫育15-20小時進行蛋白水解消化。然后將消化反應用甲酸(pH=1-2)酸化,并使用LC-MS進行分析。SEQ ID NO:46提供了膦絲菌素乙酰轉移酶(PAT)的蛋白質序列:
MSPERRPVEIRPATAADMAAVCDIVNHYIETSTVNFRTEPQTPQEWIDDLERLQDRYPWLVAEVEGVVAGIAYAGPWKARNAYDWTVESTVYVSHRHQRLGLGSTLYTHLLKSMEAQGFKSVVAVIGLPNDPSVRLHEALGYTARGTLRAAGYKHGGWHDVGFWQRDFELPAPPRPVRPVTQI.
在計算機上分析和消化PAT的蛋白質序列以產生待檢測的理論肽片段并通過LC-MS進行測量。胰蛋白酶消化后的膦絲菌素乙酰轉移酶(PAT)的候選特征肽列于表3中。
令人驚訝的是,與來自酶聯(lián)免疫吸附測定(ELISA)或其他定量方法的結果相比,使用LC-MS進行定量,三個候選特征肽提供了良好的相關性。這三個特征肽是TEPQTPQEWIDDLER(SEQ ID NO:49)、SVVAVIGLPNDPSVR(SEQ ID NO:55)、和LHEALGYTAR(SEQ ID NO:56)。通過與上述相同的消化過程,這些序列的商業(yè)合成肽以及微生物衍生的PAT蛋白都用作分析參考標準品,其中合成肽可以直接用作蛋白質定量的分析參考標準品。
來自HRAM LC-MS的標準色譜圖500ng/mL合成肽的代表性數據顯示在圖8中,其中在總離子電流(上數第一圖);合并的提取離子(上數第二圖);提取離子928.9367m/z–TEPQTPQEWIDDLER(2+)(上數第三圖或中間圖);提取離子761.9330m/z-SVVAVIGLPNDPSVR(2+)(倒數第二圖);和提取離子565.8013m/z-LHEALGYTAR(2+)(倒數第一圖)中進行比較可以鑒定每個特征肽的特征峰。所有離子的提取窗口為2.0ppm。
來自HRAM LC-MS的的胰蛋白酶消化的轉基因大豆樣品色譜圖另外的代表性數據顯示在圖9中,其中在總離子電流(上數第一圖);合并的提取離子(上數第二圖);提取離子928.9367m/z–TEPQTPQEWIDDLER(2+)(上數第三圖或中間圖);提取離子761.9330m/z-SVVAVIGLPNDPSVR(2+)(倒數第二圖);和提取離子565.8013m/z-LHEALGYTAR(2+)(倒數第一圖)中進行比較也可以鑒定每個特征肽的特征峰。所有離子的提取窗口為2.0ppm。
可以計算每個特征肽的特征峰的峰面積,并且具有肽注釋的疊加的HRAM LC-MS標準(上圖)和轉基因(下圖)提取的離子色譜圖的代表性數據顯示在圖10中用于定量。所有離子的提取窗口為2.0ppm。
序列表
<110> 美國陶氏益農公司
Oman, Trent J.
Hill, Ryan C.
Schafer, Barry W.
Gilbert, Jeffrey R.
Shan, Guomin
<120> 轉基因蛋白的定量分析
<130> 75620
<160> 60
<170> PatentIn version 3.5
<210> 1
<211> 445
<212> PRT
<213> 擬南芥(Arabidopsis thaliana)
<400> 1
Met Ala Gly Ala Glu Glu Ile Val Leu Gln Pro Ile Lys Glu Ile Ser
1 5 10 15
Gly Thr Val Lys Leu Pro Gly Ser Lys Ser Leu Ser Asn Arg Ile Leu
20 25 30
Leu Leu Ala Ala Leu Ser Glu Gly Thr Thr Val Val Asp Asn Leu Leu
35 40 45
Asn Ser Glu Asp Val His Tyr Met Leu Gly Ala Leu Arg Thr Leu Gly
50 55 60
Leu Ser Val Glu Ala Asp Lys Ala Ala Lys Arg Ala Val Val Val Gly
65 70 75 80
Cys Gly Gly Lys Phe Pro Val Glu Asp Ala Lys Glu Glu Val Gln Leu
85 90 95
Phe Leu Gly Asn Ala Gly Ile Ala Met Arg Ser Leu Thr Ala Ala Val
100 105 110
Thr Ala Ala Gly Gly Asn Ala Thr Tyr Val Leu Asp Gly Val Pro Arg
115 120 125
Met Arg Glu Arg Pro Ile Gly Asp Leu Val Val Gly Leu Lys Gln Leu
130 135 140
Gly Ala Asp Val Asp Cys Phe Leu Gly Thr Asp Cys Pro Pro Val Arg
145 150 155 160
Val Asn Gly Ile Gly Gly Leu Pro Gly Gly Lys Val Lys Leu Ser Gly
165 170 175
Ser Ile Ser Ser Gln Tyr Leu Ser Ala Leu Leu Met Ala Ala Pro Leu
180 185 190
Ala Leu Gly Asp Val Glu Ile Glu Ile Ile Asp Lys Leu Ile Ser Ile
195 200 205
Pro Tyr Val Glu Met Thr Leu Arg Leu Met Glu Arg Phe Gly Val Lys
210 215 220
Ala Glu His Ser Asp Ser Trp Asp Arg Phe Tyr Ile Lys Gly Gly Gln
225 230 235 240
Lys Tyr Lys Ser Pro Lys Asn Ala Tyr Val Glu Gly Asp Ala Ser Ser
245 250 255
Ala Ser Tyr Phe Leu Ala Gly Ala Ala Ile Thr Gly Gly Thr Val Thr
260 265 270
Val Glu Gly Cys Gly Thr Thr Ser Leu Gln Gly Asp Val Lys Phe Ala
275 280 285
Glu Val Leu Glu Met Met Gly Ala Lys Val Thr Trp Thr Glu Thr Ser
290 295 300
Val Thr Val Thr Gly Pro Pro Arg Glu Pro Phe Gly Arg Lys His Leu
305 310 315 320
Lys Ala Ile Asp Val Asn Met Asn Lys Met Pro Asp Val Ala Met Thr
325 330 335
Leu Ala Val Val Ala Leu Phe Ala Asp Gly Pro Thr Ala Ile Arg Asp
340 345 350
Val Ala Ser Trp Arg Val Lys Glu Thr Glu Arg Met Val Ala Ile Arg
355 360 365
Thr Glu Leu Thr Lys Leu Gly Ala Ser Val Glu Glu Gly Pro Asp Tyr
370 375 380
Cys Ile Ile Thr Pro Pro Glu Lys Leu Asn Val Thr Ala Ile Asp Thr
385 390 395 400
Tyr Asp Asp His Arg Met Ala Met Ala Phe Ser Leu Ala Ala Cys Ala
405 410 415
Glu Val Pro Val Thr Ile Arg Asp Pro Gly Cys Thr Arg Lys Thr Phe
420 425 430
Pro Asp Tyr Phe Asp Val Leu Ser Thr Phe Val Lys Asn
435 440 445
<210> 2
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 2
Ala Gly Ala Glu Glu Ile Val Leu Gln Pro Ile Lys
1 5 10
<210> 3
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 3
Glu Ile Ser Gly Thr Val Lys
1 5
<210> 4
<211> 31
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 4
Ile Leu Leu Leu Ala Ala Leu Ser Glu Gly Thr Thr Val Val Asp Asn
1 5 10 15
Leu Leu Asn Ser Glu Asp Val His Tyr Met Lys Gly Ala Leu Arg
20 25 30
<210> 5
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 5
Thr Leu Gly Leu Ser Val Glu Ala Asp Lys
1 5 10
<210> 6
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 6
Ala Val Val Val Gly Cys Gly Gly Lys
1 5
<210> 7
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 7
Phe Pro Val Glu Asp Ala Lys
1 5
<210> 8
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 8
Glu Glu Val Gln Leu Phe Leu Gly Asn Ala Gly Ile Ala Met Arg
1 5 10 15
<210> 9
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 9
Ser Leu Thr Ala Ala Val Thr Ala Ala Gly Gly Asn Ala Thr Tyr Val
1 5 10 15
Leu Asp Gly Val Pro Arg
20
<210> 10
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 10
Glu Arg Pro Ile Gly Asp Leu Val Val Gly Leu Lys
1 5 10
<210> 11
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 11
Gln Leu Gly Ala Asp Val Asp Cys Phe Leu Gly Thr Asp Cys Pro Pro
1 5 10 15
Val Arg
<210> 12
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 12
Val Asn Gly Ile Gly Gly Leu Pro Gly Gly Lys
1 5 10
<210> 13
<211> 31
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 13
Leu Ser Gly Ser Ile Ser Ser Gln Tyr Leu Ser Ala Leu Leu Met Ala
1 5 10 15
Ala Pro Leu Ala Leu Gly Asp Val Glu Ile Glu Ile Ile Asp Lys
20 25 30
<210> 14
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 14
Leu Ile Ser Ile Pro Tyr Val Glu Met Thr Leu Arg
1 5 10
<210> 15
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 15
Ala Glu His Ser Asp Ser Trp Asp Arg
1 5
<210> 16
<211> 40
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 16
Asn Ala Tyr Val Glu Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala
1 5 10 15
Gly Ala Ala Ile Thr Gly Gly Thr Val Thr Val Glu Gly Cys Gly Thr
20 25 30
Thr Ser Leu Gln Gly Asp Val Lys
35 40
<210> 17
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 17
Phe Ala Glu Val Leu Glu Met Met Gly Ala Lys
1 5 10
<210> 18
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 18
Val Thr Trp Thr Glu Thr Ser Val Thr Val Thr Gly Pro Pro Arg
1 5 10 15
<210> 19
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 19
Ala Ile Asp Val Asn Met Asn Lys
1 5
<210> 20
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 20
Met Pro Asp Val Ala Met Thr Leu Ala Val Val Ala Leu Phe Ala Asp
1 5 10 15
Gly Pro Thr Ala Ile Arg
20
<210> 21
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 21
Asp Val Ala Ser Trp Arg
1 5
<210> 22
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 22
Leu Gly Ala Ser Val Glu Glu Gly Pro Asp Tyr Cys Ile Ile Thr Pro
1 5 10 15
Pro Glu Lys
<210> 23
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 23
Leu Asn Val Thr Ala Ile Asp Thr Tyr Asp Asp His Arg
1 5 10
<210> 24
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 24
Met Ala Met Ala Phe Ser Leu Ala Ala Cys Ala Glu Val Pro Val Thr
1 5 10 15
Ile Arg
<210> 25
<211> 14
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 25
Thr Phe Pro Asp Tyr Phe Asp Val Leu Ser Thr Phe Val Lys
1 5 10
<210> 26
<211> 293
<212> PRT
<213> Delftia acidovorans
<400> 26
Met Ala Gln Thr Thr Leu Gln Ile Thr Pro Thr Gly Ala Thr Leu Gly
1 5 10 15
Ala Thr Val Thr Gly Val His Leu Ala Thr Leu Asp Asp Ala Gly Phe
20 25 30
Ala Ala Leu His Ala Ala Trp Leu Gln His Ala Leu Leu Ile Phe Pro
35 40 45
Gly Gln His Leu Ser Asn Asp Gln Gln Ile Thr Phe Ala Lys Arg Phe
50 55 60
Gly Ala Ile Glu Arg Ile Gly Gly Gly Asp Ile Val Ala Ile Ser Asn
65 70 75 80
Val Lys Ala Asp Gly Thr Val Arg Gln His Ser Pro Ala Glu Trp Asp
85 90 95
Asp Met Met Lys Val Ile Val Gly Asn Met Ala Trp His Ala Asp Ser
100 105 110
Thr Tyr Met Pro Val Met Ala Gln Gly Ala Val Phe Ser Ala Glu Val
115 120 125
Val Pro Ala Val Gly Gly Arg Thr Cys Phe Ala Asp Met Arg Ala Ala
130 135 140
Tyr Asp Ala Leu Asp Glu Ala Thr Arg Ala Leu Val His Gln Arg Ser
145 150 155 160
Ala Arg His Ser Leu Val Tyr Ser Gln Ser Lys Leu Gly His Val Gln
165 170 175
Gln Ala Gly Ser Ala Tyr Ile Gly Tyr Gly Met Asp Thr Thr Ala Thr
180 185 190
Pro Leu Arg Pro Leu Val Lys Val His Pro Glu Thr Gly Arg Pro Ser
195 200 205
Leu Leu Ile Gly Arg His Ala His Ala Ile Pro Gly Met Asp Ala Ala
210 215 220
Glu Ser Glu Arg Phe Leu Glu Gly Leu Val Asp Trp Ala Cys Gln Ala
225 230 235 240
Pro Arg Val His Ala His Gln Trp Ala Ala Gly Asp Val Val Val Trp
245 250 255
Asp Asn Arg Cys Leu Leu His Arg Ala Glu Pro Trp Asp Phe Lys Leu
260 265 270
Pro Arg Val Met Trp His Ser Arg Leu Ala Gly Arg Pro Glu Thr Glu
275 280 285
Gly Ala Ala Leu Val
290
<210> 27
<211> 63
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 27
Met Ala Gln Thr Thr Leu Gln Ile Thr Pro Thr Gly Ala Thr Leu Leu
1 5 10 15
Gly Ala Thr Val Thr Gly Val His Leu Ala Thr Leu Asp Asp Ala Gly
20 25 30
Phe Ala Ala Leu His Ala Ala Trp Leu Gln His Ala Leu Leu Ile Phe
35 40 45
Pro Gly Gln His Leu Ser Asn Asp Gln Gln Ile Thr Phe Ala Lys
50 55 60
<210> 28
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 28
Phe Gly Ala Ile Glu Arg
1 5
<210> 29
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 29
Ile Gly Gly Gly Asp Ile Val Ala Ile Ser Asn Val Lys
1 5 10
<210> 30
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 30
Ala Asp Gly Thr Val Arg
1 5
<210> 31
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 31
Gln His Ser Pro Ala Glu Trp Asp Asp Met Met Lys
1 5 10
<210> 32
<211> 35
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 32
Val Ile Val Gly Asn Met Ala Trp His Ala Asp Ser Thr Tyr Met Pro
1 5 10 15
Val Met Ala Gln Gly Ala Val Phe Ser Ala Glu Val Val Pro Ala Val
20 25 30
Gly Gly Arg
35
<210> 33
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 33
Thr Cys Phe Ala Asp Met Arg
1 5
<210> 34
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 34
Ala Ala Tyr Asp Ala Leu Asp Glu Ala Thr Arg
1 5 10
<210> 35
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 35
Ala Leu Val His Gln Arg
1 5
<210> 36
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 36
His Ser Leu Val Tyr Ser Gln Ser Lys
1 5
<210> 37
<211> 28
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 37
Leu Gln His Val Gln Gln Ala Gly Ser Ala Tyr Ile Gly Tyr Gly Met
1 5 10 15
Asp Thr Thr Ala Thr Pro Leu Arg Pro Leu Val Lys
20 25
<210> 38
<211> 14
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 38
Val His Pro Glu Thr Gly Arg Pro Ser Leu Leu Ile Gly Arg
1 5 10
<210> 39
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 39
His Ala His Ala Ile Pro Gly Met Asp Ala Ala Glu Ser Glu Arg
1 5 10 15
<210> 40
<211> 14
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 40
Phe Leu Glu Gly Leu Val Asp Trp Ala Cys Gln Ala Pro Arg
1 5 10
<210> 41
<211> 17
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 41
Val His Ala His Gln Trp Ala Ala Gly Asp Val Val Val Trp Asp Asn
1 5 10 15
Arg
<210> 42
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 42
Cys Leu Leu His Arg
1 5
<210> 43
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 43
Ala Glu Pro Trp Asp Phe Lys
1 5
<210> 44
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 44
Val Met Trp His Ser Arg
1 5
<210> 45
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 45
Leu Ala Gly Arg Pro Glu Thr Glu Gly Ala Ala Leu Val
1 5 10
<210> 46
<211> 183
<212> PRT
<213> Streptomyces viridochromogenes
<400> 46
Met Ser Pro Glu Arg Arg Pro Val Glu Ile Arg Pro Ala Thr Ala Ala
1 5 10 15
Asp Met Ala Ala Val Cys Asp Ile Val Asn His Tyr Ile Glu Thr Ser
20 25 30
Thr Val Asn Phe Arg Thr Glu Pro Gln Thr Pro Gln Glu Trp Ile Asp
35 40 45
Asp Leu Glu Arg Leu Gln Asp Arg Tyr Pro Trp Leu Val Ala Glu Val
50 55 60
Glu Gly Val Val Ala Gly Ile Ala Tyr Ala Gly Pro Trp Lys Ala Arg
65 70 75 80
Asn Ala Tyr Asp Trp Thr Val Glu Ser Thr Val Tyr Val Ser His Arg
85 90 95
His Gln Arg Leu Gly Leu Gly Ser Thr Leu Tyr Thr His Leu Leu Lys
100 105 110
Ser Met Glu Ala Gln Gly Phe Lys Ser Val Val Ala Val Ile Gly Leu
115 120 125
Pro Asn Asp Pro Ser Val Arg Leu His Glu Ala Leu Gly Tyr Thr Ala
130 135 140
Arg Gly Thr Leu Arg Ala Ala Gly Tyr Lys His Gly Gly Trp His Asp
145 150 155 160
Val Gly Phe Trp Gln Arg Asp Phe Glu Leu Pro Ala Pro Pro Arg Pro
165 170 175
Val Arg Pro Val Thr Gln Ile
180
<210> 47
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 47
Met Ser Pro Glu Arg
1 5
<210> 48
<211> 32
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 48
Arg Pro Val Glu Ile Arg Pro Ala Thr Ala Ala Asp Met Ala Ala Val
1 5 10 15
Cys Asp Ile Val Asn His Tyr Ile Glu Thr Ser Thr Val Asn Phe Arg
20 25 30
<210> 49
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 49
Thr Glu Pro Gln Thr Pro Gln Glu Trp Ile Asp Asp Leu Glu Arg
1 5 10 15
<210> 50
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 50
Leu Gln Asp Arg
1
<210> 51
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 51
Tyr Pro Trp Leu Val Ala Glu Val Glu Gly Val Val Ala Gly Ile Ala
1 5 10 15
Tyr Ala Gly Pro Trp Lys
20
<210> 52
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 52
Asn Ala Tyr Asp Trp Thr Val Glu Ser Thr Val Tyr Val Ser His Arg
1 5 10 15
<210> 53
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 53
Leu Gly Leu Gly Ser Thr Leu Tyr Thr His Leu Leu Lys
1 5 10
<210> 54
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 54
Ser Met Glu Ala Gln Gly Phe Lys
1 5
<210> 55
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 55
Ser Val Val Ala Val Ile Gly Leu Pro Asn Asp Pro Ser Val Arg
1 5 10 15
<210> 56
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 56
Leu His Glu Ala Leu Gly Tyr Thr Ala Arg
1 5 10
<210> 57
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 57
Gly Thr Leu Arg
1
<210> 58
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 58
Ala Ala Gly Tyr Lys
1 5
<210> 59
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 59
His Gly Gly Trp His Asp Val Gly Phe Trp Gln Arg
1 5 10
<210> 60
<211> 17
<212> PRT
<213> 人工序列
<220>
<223> 候選特征肽
<400> 60
Asp Phe Glu Leu Pro Ala Pro Pro Arg Pro Val Arg Pro Val Thr Gln
1 5 10 15
Ile