專利名稱:分泌型肺炎鏈球菌蛋白質的制作方法
分泌型肺炎鏈球菌蛋白 質本申請是2002年3月28日提交的第02810868. X號發(fā)明專利申請“分泌型肺炎鏈球菌蛋白質”的分案申請。本發(fā)明涉及源自肺炎鏈球菌(Str印tococcus pneumomiae)的蛋白質、編碼這些蛋白質的核酸分子、上述核酸和/或蛋白質作為抗原/免疫原和在檢測/診斷中的用途,以及篩選蛋白/核酸序列作為可能的抗菌靶標的方法。肺炎鏈球菌,通常稱為肺炎球菌,是一種重要的致病生物。肺炎鏈球菌感染在發(fā)展中國家和發(fā)達國家與人類疾病持續(xù)重要的關系已有權威性的論述(Fiber,G. R.,Science, 265 1385-1387 (1994))。這篇文章指出,在世界范圍內,該細菌被認為是急性呼吸系統(tǒng)感染最常見的致病菌,估計每年造成一百萬兒童死亡,多數在發(fā)展中國家(Stansfield,S.K., Pediatr. Infect. Dis.,6 :622(1987))。在美國,肺炎球菌仍被認為是細菌性肺炎最常見的致病因素(Breiman等人,Arch. Intern. Med.,150 1401 (1990)),該病的發(fā)病率在幼童、老年人及處于誘病因素狀態(tài)的患者中尤其高,諸如無脾、心臟、肺和腎臟疾病患者,糖尿病、酒精中毒病人或者免疫抑制失調者,尤其是艾滋病人。這些人群發(fā)生肺炎球菌敗血癥以至腦膜炎的風險很高,因此死于肺炎球菌感染的風險很大。據信美國每年有超過50,000例侵入性肺炎球菌患者(腦膜炎和菌血癥)。肺炎球菌還是中耳炎和鼻竇炎最主要的致病菌,在發(fā)達國家兒童中該菌仍然流行感染,這導致重大的代價。僅在美國一個國家,在兩歲以下兒童中大概有七百萬例肺炎鏈球菌弓丨起的中耳感染。由于最近出現(xiàn)了青霉素抗性菌株,因此更加需要有效預防肺炎球菌感染的措施。 據報道,美國12個州的13家醫(yī)院的肺炎球菌分離物中,有6. 6%具有青霉素抗性,其中一些分離株還對其它抗生素具有抗性,包括第三代環(huán)孢菌素(Schappert,S. Μ.,Vital and HealthStatistics of the Centres for Disease Control/National Centre for Health Statistics,214 :1 (1992)) 0在一些醫(yī)院,青霉素抗性的發(fā)生率甚至更高(高達20% ) (Breiman等人,J. Am. Med. Assoc.,271 1831 (1994))。在青霉素一直作為肺炎球菌有效的治療藥物幾十年后,由于其抗性菌株在近期的突然出現(xiàn),因此這些發(fā)現(xiàn)被認為是一種警示。綜上所述,有必要考慮提高肺炎球菌疾病的預防、控制、診斷或治療方法。多種方法用于提供預防肺炎球菌感染的疫苗。例如,鑒于肺炎球菌有多種血清型 (至少90種),因此存在多種困難,血清型是根據包裹菌體的多糖莢膜的結構劃分的。對一種血清型有效的疫苗對其它血清型無效,這意味著對大多數病例有效的疫苗必須包含全部血清型的多糖抗原。另一個出現(xiàn)的問題是,當純化的莢膜多糖(每一種莢膜多糖都決定著血清分型并是主要的保護抗原)用做疫苗時,在兩歲以下兒童中誘導保護性抗體反應并不可靠,而這個年齡群患上侵入性肺炎球菌感染和腦膜炎的機率卻最高。為誘導增強的免疫應答,尤其是T細胞依賴性的免疫應答,一種改進的使用莢膜抗原的方法將多糖與蛋白質綴合。這種方法已經用于針對流感嗜血桿菌(Haemophilus influenzae)的疫苗的開發(fā)。但是有關多種多糖疫苗和以綴合物為基礎的疫苗的成本的問題仍然存在。另外,由于綴合物疫苗提供的血清型覆蓋面有限,因此這種疫苗組合物應當根據地區(qū)和人群的不同加以改變。由于施用載體蛋白質總劑量相對較大,還可能出現(xiàn)載體誘導的免疫抑制或過載的問題。第三種方法是尋找有潛力成為疫苗候選物的其它抗原性成分。這是本發(fā)明的基礎。利用一種專門開發(fā)的細菌表達系統(tǒng),我們能夠從肺炎球菌中鑒定出一組蛋白質抗原,它們與菌體外膜相關或由菌體分泌。因此,本發(fā)明首先提供了一種肺炎鏈球菌的蛋白質或多肽,其具有選自表1所示的序列。
本發(fā)明的蛋白質或多肽可以基本上純的形式提供。例如,它可以基本上不含其它蛋白質的形式提供。如在此所討論的,本發(fā)明的蛋白質和多肽可用作抗原性物質。這些物質具有“抗原性”和/或“免疫原性”。一般情況下,“抗原性”是指該蛋白質或多肽能用于產生抗體,或者實際上能在受試者體內誘導抗體反應?!懊庖咴浴笔侵冈摰鞍踪|或多肽能在受試者體內激發(fā)保護性的免疫應答。因此,在后一種情況下,該蛋白質或多肽不僅能產生抗體反應,而且, 能產生不依賴抗體的免疫應答。技術人員應當理解,本發(fā)明蛋白質或多肽的同源物或衍生物同樣可應用于本發(fā)明,即用作抗原性/免疫原性物質。例如,包含一個或多個添加、缺失、取代等的蛋白質或多肽包括在本發(fā)明的范圍內。另外,可以將一個氨基酸用另一個相似“類型”的氨基酸取代。 例如用一個疏水性的氨基酸替換另一個疏水性的氨基酸。技術人員可以使用程序,例如CLUSTAL 程序進行氨基酸序列比較。該程序能比較氨基酸序列并通過在兩個序列的合適位置插入空格而找出最佳的比對。對于一個最佳比對,可計算出氨基酸的一致性或相似性(一致性加上氨基酸類型的保守性)。象BLASTx這樣的程序,能比對出最長的相似序列,并給出相似性的分值。因此就有可能得到一組對比序列,它們之間有幾個相似的區(qū)域,每個相似區(qū)域都有不同的分值。本發(fā)明考慮了上述兩種一致性分析。對于同源物和衍生物,它們保留的原蛋白質或多肽的抗原性或免疫原性的程度, 比它們與此處描述的蛋白質或多肽的一致性程度更重要。但是,提供了合適的同源物或衍生物,其與此處描述的蛋白質或多肽至少要有60%的相似性(如前所述)。優(yōu)選,提供的同源物或衍生物至少有70%相似性,更優(yōu)選,至少有80%的相似性。最優(yōu)選,提供的同源物或衍生物至少有90%或者甚至95%的相似性。在另一研究中,同源物或衍生物也可是融合蛋白,融合部分可使純化更加容易,例如通過有效地給目的蛋白質或多肽加標簽。在使用時可能需要移去“標簽”,或者融合蛋白本身保留了足夠有用的抗原性。另一方面,本發(fā)明還提供蛋白質或多肽,或其同源物或衍生物的抗原性/免疫原性片段。對于此處描述的蛋白質或多肽,或其同源物或衍生物的片段,情況略有不同。眾所周知,可以篩選抗原性蛋白或多肽來確定抗原表位區(qū),即那些引起蛋白質或多肽抗原性或免疫原性的區(qū)域。本領域的技術人員熟知這些篩選方法。所以,本發(fā)明中的片段應當包含一個或多個這樣的表位區(qū),或者與這些區(qū)域有足夠高的同源性,以保持抗原性/免疫原性。 因此,本發(fā)明中的片段可與一致性無關,因為它們可能只與此處描述的蛋白質或多肽,同源物或衍生物的特定部分100%—致。再次指出,關鍵是這些片段還保持著抗原性/免疫原性。對于同源物、衍生物和片段,重要的是它們至少具有一定程度的其所源自的蛋白質或多肽的抗原性/免疫原性。本發(fā)明的蛋白質可利用基因克隆技術以基本上純化的形式提供。這些技術已經公開,例如在例如在 J. Sambrook等人,MolecularCloning 2nd Edition,Cold Spring Harbor Laboratory Press (1989)中。因此,第二方面,本發(fā)明還提供包含或由下述序列構成的核酸分子(i)表1列出的任何DNA序列或其RNA等同物;(ii)與⑴中任何序列互補的序列;(iii)與(i)或(ii)中序列編碼相同蛋白質或多肽的序列;(iv)與(i)、(ii)和(iii)中的任何序列基本相同的序列;(ν)編碼表1定義的蛋白質的同源物、衍生物或片段的序列。本發(fā)明的核酸分子可能包括多個這樣的序列和/或片段。技術人員應能理解,本發(fā)明還包括下面舉例說明的一些具體的新核酸分子的新的變體。這些變體也包括在本發(fā)明的范圍內。這些變體可自然發(fā)生,例如由于菌種變異。例如,包括添加、替換和/或缺失。另外,特別在使用微生物表達系統(tǒng)時,技術人員可能希望使用特定的用于表達的微生物中公知的偏好密碼子設計核酸序列。因此,合成的或非天然發(fā)生的變異體也包括在本發(fā)明的范圍內。上文中使用的術語“RNA等同物”,是指給定的RNA分子的序列與給定的DNA分子序列互補(允許RNA中的“U”替換基因密碼中的“Τ”)當比較核酸序列以確定相似或一致的程度時,技術人員可使用一些程序,例如 BESTFIT 和 GAP (二者均出自 Wisconsin GeneticsComputer Group (GCG)的軟件包)。以 BEDTFIT為例,它比較兩個序列并給出最相似區(qū)段的最佳比對。GAP能比對序列的全長,并通過在兩個序列中插入合適的空格而找出最佳的比對。在本發(fā)明中,當討論核酸序列的一致性時,適合通過排列序列的全長進行比較。優(yōu)選,基本一致的序列與所述序列至少有50%的序列一致性,較好的是至少有 75%的序列一致性,更好的是至少有90%或至少95%的序列一致性。在某些情況下,序列一致性可達99%或更高。術語“基本一致”的合適理解是,該序列與此處描述的任何序列的一致程度高于和現(xiàn)有技術中核酸序列的一致程度。但應當指出的是,本發(fā)明中的核酸序列至少編碼某一新基因產物的一部分,編碼新基因產物或其新的部分的所有可能的序列均包括在本發(fā)明范圍內。核酸分子可以分離或重組的形式存在。它可以連接到載體上,該載體可以整合到宿主中。這些載體和適宜的宿主形成了本發(fā)明的另一方面。因此,例如,使用基于此處提供的核酸序列設計的探針,可鑒定肺炎鏈球菌的基因。然后它們可用限制性內切酶切出并克隆進載體。該載體可轉入合適的宿主進行表達。通過使用與核酸分子部分序列互補的合適探針,可從肺炎鏈球菌中獲得本發(fā)明的核酸分子。利用限制性內切酶或超聲波技術,可獲得大小合適的片段用作探針。PCR技術也可用于擴增目的核酸序列。所以,此處提供的序列數據可用于設計PCR中使用的兩條引物,這樣包括全長基因或其片段的目的序列,可成為目標并被高度擴增。一般引物的長至少15-25個核苷酸。另外,還可使用化學合成。這可以自動化。相對短的序列可以化學合成,并連接在一起形成長序列。利用此處描述的細菌表達系統(tǒng)鑒定出了另外一組肺炎鏈球菌蛋白質。這些是已知的肺炎鏈球菌蛋白質,但此前沒有鑒定為抗原性蛋白質。表2列出了這組蛋白質的氨基酸序列,和編碼它們的DNA序列。這些蛋白質、或其同源物、衍生物和/或片段,也可用作抗原
/免疫原。 另一組與ID-304L1有一定程度同源性的蛋白質從最近發(fā)表的肺炎鏈球菌基因組中鑒定出來,它們均在N端或近N端的位置具有下述23個氨基酸的高度保守的序列 MELVLPNNYVV (D,A) I (L) D (E) E (Q) EEMMYLDGG (E),括號內的殘基是前面氨基酸的替換殘基。 表3給出了這些同源物的氨基酸序列和編碼它們的DNA序列。所以,另一方面本發(fā)明提供肺炎鏈球菌的蛋白質、或其片段或同源物或衍生物,該蛋白質 N 末端序列為 MELVLPNNYVV (D, A) I (L) D (E) E (Q) EEMMYLDGG (E)。另一方面,本發(fā)明提供了具有選自表1到3所示序列的蛋白質或多肽、或其同源物、衍生物和/或片段作為免疫原和/或抗原的用途。另一方面,本發(fā)明還提供了一種免疫原性/抗原性組合物,包含一種或多種其序列選自表1到3所示序列的蛋白質或多肽、或其同源物或衍生物、和/或任何這些分子的片段。在優(yōu)選的實施方案中,該免疫原性/抗原性組合物是疫苗或用于診斷化驗。作為疫苗時,可包括適當添加的賦形劑、稀釋劑、佐劑或類似物質。有很多這些方面的實例為本領域所熟知。還可使用表1和2所示的核酸序列制備所謂的DNA疫苗。所以,本發(fā)明還提供了一種疫苗組合物,包括一種或多種此處所定義的核酸序列。現(xiàn)有技術描述了 DNA疫苗(例如參見,Donnelly 等人,Ann. Rev. Immunol. ,15 :617_648 (1997)),技術人員根據本發(fā)明,使用此領域描述的技術,可制備和使用DNA疫苗。如此處已討論的那樣,此處描述的蛋白質或多肽、它們的同源物或衍生物、和/ 或任何這些分子的片段,可用于肺炎鏈球菌的檢測/診斷方法。這些方法可基于檢測抗這些蛋白質的抗體,這些抗體可能在檢測對象中出現(xiàn)。因此本發(fā)明提供了肺炎鏈球菌的檢測/ 診斷方法,包括將要檢測的樣品與至少一種此處描述的蛋白質、或同源物、衍生物或片段接觸的步驟。合適的樣品是生物樣品,如從檢測對象中獲取的組織樣品或血液或唾液樣品。在另一項研究中,此處描述的蛋白質、或其同源物、衍生物和/或片段,可用于產生抗體,抗體反過來可用于檢測抗原以及肺炎鏈球菌。這些抗體組成了本發(fā)明的另一面。包括在本發(fā)明范圍內的抗體可以是單克隆抗體或多克隆抗體。多克隆抗體可通過以下方式產生,將此處描述的蛋白質、或其同源物、衍生物或片段注射進合適的動物宿主,在動物中(例如小鼠、大鼠、豚鼠、兔、綿羊、山羊或猴),能刺激抗體的產生。如果需要,佐劑可與蛋白質一起使用。眾所周知的佐劑包括弗氏佐劑(完全和非完全)和氫氧化鋁。然后可利用抗體與此處描述的蛋白質結合的性能純化它們。單克隆抗體可由雜交瘤產生。這些可通過將骨髓瘤細胞和產生所需抗體的脾細胞融合,產生永生化的細胞系而形成。因此可使用眾所周知的Kohler和Milstein的技術(Nature 256 (1975)),或此技術的后續(xù)改進形式。制備與特定多肽/蛋白質結合的單克隆和多克隆抗體的技術,目前在本領域中非常成熟。標準免疫學教科書對它們有詳細描述,例如Roitt等人,Immunology second edition(1989), ChurchilILivingstone, London.。除全抗體外,本發(fā)明包括能與此處描述的蛋白質等結合的抗體的衍生物。因此本發(fā)明包括抗體片段和合成結構。Dougall等人給出了抗體片段和合成結構的例子(Tibtec, 12 :372-379 (1994 年 9 月))。例如,抗體片段包括Fab、F(ab' )2和Fv片段。Fab片段在Roitt等人[見上文] 中有祥述。Fv片段修改后可產生稱為單鏈Fv(SCFV)分子的合成結構。這包括共價連接 Vh和V1區(qū)的肽接頭,該接頭有使分子穩(wěn)定的作用。其它可用的合成結構包括互補性決定區(qū) (OTR)肽。這些是包含抗原結合決定簇的合成肽。還可使用肽模擬物(mimetics)。這些分子一般是構象被限制的有機環(huán),其模擬CDR環(huán)結構和包括抗原相互作用側鏈的結構。合成結構包括嵌合分子。因此,例如人源化的(或靈長類化的(primatised))抗體或其衍生物也包括在本發(fā)明的范圍內。人源化抗體的一個例子是具有人源的抗體骨架區(qū)和嚙齒類動物的高變區(qū)的抗體。制備嵌合抗體的方法有詳細論述,例如=Morrison等人, PNAS,81 :6851-6855(1984)和 Takeda 等人,Nature,314 :452-454 (1985)。合成結構還包括帶添加部分的分子,添加部分使分子具有除抗原結合性質外的的其他所需性質。例如該部分可能是一種標記(例如熒光或放射性標記)。另外,它可能是一種藥物活性成分??贵w或其衍生物,可用于肺炎鏈球菌的檢測/診斷。因此,另一方面本發(fā)明提供一種肺炎鏈球菌的檢測/診斷方法,它包括將要檢測的樣品與抗體接觸的步驟,該抗體能結合此處描述的一種或多種蛋白質、或其同源物、衍生物和/或片段。另外,可使用所謂的“親和體”(Affibodies)。這些是選自α -螺旋細菌受體結構域組合文庫(Nord等人Nature Biotechnology, 15 :772-7(1997))的結合蛋白質。因此,可通過組合的方法選擇能與不同靶蛋白質特異結合的小蛋白質結構域。還將明確的是,此處描述的核酸序列可用于檢測/診斷肺炎鏈球菌。因此,另一方面,本發(fā)明還提供了一種檢測/診斷肺炎鏈球菌的方法,該方法包括將要檢測的樣品與至少一種此處描述的核酸序列接觸的步驟。合適的樣品是生物樣品,如從被檢測對象中獲取的組織樣品或血液或唾液樣品。這些樣品在用于本發(fā)明的方法之前可進行預處理。例如, 可處理樣品以提取DNA。然后,以此處描述的核酸序列為基礎的DNA探針(即,一般是這些序列的片段),可用于檢測肺炎鏈球菌的核酸。另外,本發(fā)明還提供(a)針對肺炎鏈球菌免疫接種受試者的方法,包括對受試者施用本發(fā)明的蛋白質或多肽、或其衍生物、同源物或片段,或本發(fā)明的免疫組合物的步驟;(b)針對肺炎鏈球菌免疫接種受試者的方法,包括對受試者施用如此處所定義的核酸分子的步驟;(c)預防或治療肺炎鏈球菌感染的方法,包括對受試者施用本發(fā)明的蛋白質或多肽、或其衍生物、同源物或片段,或本發(fā)明免疫組合物的步驟;(d)預防或治療肺炎鏈球菌感染的方法,包括對受試者施用如此處所定義的核酸分子的步驟; (e)用于檢測/診斷肺炎鏈球菌感染的試劑盒,其包括本發(fā)明的一或多種蛋白質或多肽、或其同源物、衍生物或片段,或本發(fā)明的抗原性組合物;和(f)用于檢測/診斷肺炎鏈球菌感染的試劑盒,其包括一或多種如此處所定義的核酸分子??紤]到我們已經鑒定出了一組重要的蛋白質,這些蛋白質是抗菌治療的可能靶標。但是,必需確定每一種蛋白質對細菌的存活是否重要。因此,本發(fā)明還提供了一種確定如此處描述的蛋白質或多肽是否代表可能的抗菌靶標的方法,該方法包括拮抗、抑制、或以其它方式干擾該蛋白質的功能或表達并確定肺炎鏈球菌是否仍然存活。使蛋白質失活的合適方法是實施選擇性基因敲除,S卩,阻止該蛋白質的表達并確定其結果是否為致死性的變化。進行基因敲除的合適方法在下列論文中有描述Li等人, P. N. A. S. ,94 13251-13256 (1997)和Kolkman等人,J. Bacteriol.,178 :3736_3741 (1996)。最后一個方面,本發(fā)明提供了一種物質在制備治療或預防肺炎鏈球菌感染的藥物中的應用,其中該物質能夠拮抗、抑制、或以其它方式干擾本發(fā)明蛋白質或多肽的功能或表達。如前所述,我們使用細菌表達系統(tǒng)來鑒定蛋白質,其中那些蛋白質是表面相關的、 分泌的或輸出的并因此用作抗原或抗菌靶標。蛋白質分泌/輸出的必需信息在細菌中已經被深入研究過。多數情況下,蛋白質輸出需要一個存在于前體蛋白質N末端的信號肽,通過信號肽將蛋白質引入細胞質膜上的轉運機器。在轉運過程中或轉運之后,信號肽被膜相關的信號肽酶去除。最終,蛋白質的定位(即,是否被分泌、完整的膜蛋白或附著于細胞壁)由序列決定,而不是前導肽本身。我們對定位于表面或輸出的蛋白質特別感興趣,因為它們很可能作為抗原用于疫苗、作為診斷試劑或作為新化學物質的治療靶標。因此我們在乳酸乳球菌(Lactococcus lactis)中開發(fā)了一個篩選載體系統(tǒng),可分離和鑒定編碼輸出蛋白質的基因。下面我們提供一個代表性的例子,說明如何鑒別和表征給出的肺炎鏈球菌新的表面相關蛋白質。篩選載體結合了缺少自身輸出信號的葡萄球菌核酸酶基因nuc作為分泌報告分子。葡萄球菌核酸酶是自然分泌的、熱穩(wěn)定的單體酶,它在一系列革蘭氏陽性菌中有效表達和分泌 (Shortle,Gene,22 :181_189 (1983) ;Kovacevic 等人,J. Bacteriol.,162 :521_528 (1985); Miller 等人,J. Bacteriol.,169 :3508_3514(1987) ;Liebl 等人,J. Bacteriol.,174 1854-1861(1992) ;Le Lori 等人,J. Bacteriol. ,176 5135-5139 (1994) ;Poquet 等人, J.Bacteriol.,180 1904-1912(1998))。最近Poquet等人((1998),見上文)描述了一種篩選載體,該載體結合了缺少自身信號前導(signal leader)的nuc基因作為報告分子,用于鑒定革蘭氏陽性菌的輸出蛋白質,并在乳酸乳球菌中應用。該載體(PFUN)除帶有在大腸桿菌(Escherichia coli)和其它革蘭氏陰性菌中促進復制的ColEl復制子外,還帶有在大范圍革蘭氏陽性菌中發(fā)揮功能的ρΑΜβ 1復制子。該載體上獨特的克隆位點可用于產生轉錄和翻譯的融合體,該融合體在克隆的基因組DNA片段和缺失自身分泌信號前導的截斷的nuc基因之間形成。nuc基因是理想的報告基因,因為核酸酶的分泌容易被簡單和靈敏的平皿實驗檢測;分泌核酸酶的重組克隆形成粉紅色的暈圈,而對照克隆仍保持白色(Shortle,(1983),見上文;Le Lori等人,(1994),見上文)。因此參考下面代表性的例子來描述本發(fā)明,這些例子提供了如何把此處描述的蛋白質、多肽和核酸序列鑒定為抗原性靶標的細節(jié)。這里我們描述了三種報告載體的構建,和它們在乳酸乳球菌中鑒定和分離肺炎鏈球菌中編碼分泌或表面相關蛋白質的基因組DNA片段的用途。另外,使用DNA印跡雜交實驗證明在一系列肺炎鏈球菌株中存在疫苗候選基因。現(xiàn)在要參考實施例來描述本發(fā)明,實施例在任何情況下都不作為限制本發(fā)明的解釋。實施例1(i)pTREPl-nuc系列報告載體的構建(a)表達質粒pTREPl的構建pTREPl質粒是高拷貝數00-80每細胞)θ -復制革蘭氏陽性質粒,它衍生自pTREX 質粒,pTREX本身衍生自以前公開的pIL253質粒。pIL253帶有ρΑΜβ 1復制子,該復制子有廣泛的革蘭氏陽性宿主范圍(Simon和Chopin, Biochimie,70 :559-567 (1988)),并且乳酸乳球菌的性因子(sex-factor)不能轉移該質粒。pIL253還缺少tra功能,該功能為通過結合母體質粒(conjugative parent plasmids),例如pIL501轉移或有效移動所必需的。腸球菌復制子ρΑΜβΙ以前已被轉移到多種細菌中,包括鏈球菌、乳酸桿菌(Lactobacillus) 和芽孢桿菌(Bacillus)以及丙酮丁醇梭狀芽孢桿菌(Clostridiumacetobutylicum) (Oultram 和 Klaenhammer,F(xiàn)EMS MicrobiologicalLetters, 27 :129-134(1985) ;Gibson 等人’ (1979) ;LeBlanc 等人,Proceedings of the National Academy of Science USA, 75: 3484-3487(1978)),這說明ρΑΜβ 1可應用于廣泛的宿主范圍pTRETl質粒代表組成型轉錄載體。pTREX載體的構建如下。通過將兩條互補的寡核苷酸退火并用Tfl DNA聚合酶延伸生成一條人造DNA片段,該片段包括推定的RNA穩(wěn)定序列、翻譯起始區(qū)(TIR)、插入目的基因的多克隆位點和轉錄終止子。為便于克隆,有義和反義寡核苷酸分別在其5'末端帶有Nhe I和BamHI的識別位點。此片段被克隆在pUC19NT7的XbaI和BamHI位點之間, PUC19NT7 衍生自 pUC19,后帶有來自 pLETl 的 T7 表達盒(Wells 等人,J. Appl. Bacteriol., 74 =629-636 (1993)),該表達盒克隆在EcoRI和HindIII位點之間。構建結果稱為pUCLEX。 然后先用HindIII酶切,平端化后再用EcoRI酶切以移出pUCLEX完整的表達盒,再克隆到 PIL253的EcoRI和SacI (平端化的)位點之間,從而形成pTREX載體(Wells和Schofield, In Current advances in metabolism, genetics and applications—NATO ASI Series,H 98 :37-62 (1996))。推定的RNA穩(wěn)定序列和IlR來自大腸桿菌T7噬菌體序列,并對其中一個核苷酸位點進行了修飾以增強Siine Dalgarno(SD)基序與乳酸乳球菌核糖體16S RNA的互補能力(Schofield 等人,pers. corns. University of Camberidge Dept. Pathology.)。后來被稱為T7的具有啟動子活性的乳酸乳球菌MG1363染色體DNA片段,被克隆進表達盒的EcoRI和BglII位點之間,從而產生PTREX7。以前已利用啟動子探針載體 PSB292分離到這個有效的啟動子區(qū)域(Waterfield等人,Gene,165 :9-15 (1995))。根據制造商的說明使用Vent DNA聚合酶PCR擴增該啟動子片段。然后pTREPl載體的構建如下。通過將兩條部分重疊的互補的合成寡核苷酸一起退火,并根據制造商的說明用測序酶延伸,生成一條人造DNA片段,該片段包括轉錄終止子、PUC上游測序引物、啟動子多克隆位點區(qū)和通用翻譯終止序列。為便于克隆到PTREX7 中,有義和反義(pTREPjP pTREPK)寡核苷酸分別在其5 ‘末端帶有EcoRV和BamHI的識別位點。轉錄終止子來自芽孢桿菌青霉素酶基因,已被證明在乳球菌中有效(Jos等人,Applied and Environmental Microbiology,50 :540-542 (1985))。轉錄終止子被認為是必需的,因為觀察到PTREX載體在表達目的基因時滲漏,并認為是起始區(qū)段隱藏的啟動子活性造成的結果(Schofield 等人,pers. corns. University of CamberidgeDept. Pathology.)。包含的pUC上游測序引物能引導克隆DNA片段的測序。包含的翻譯終止序列以3種不同的閱讀框架編碼終止密碼子,以防止載體基因和克隆的DNA片段之間出現(xiàn)翻譯融合體。PTREX7載體先用EcoRI消化,并根據制造商的說明用T4DNA聚合酶(NEB)的5' -3'聚合酶活性平端化。EcoRI消化并平端化的PTREX7載體再用BglII消化以移出P7啟動子。然后,由合成寡核苷酸退火獲得的人造DNA片段用EcoRV和BamHI消化,并克隆進EcoRI (平端化)-BglII 消化的PTREX7載體,形成pTREP。再將稱為Pl的乳酸乳球菌MG1363染色體啟動子克隆到 pTREP表達盒的EcoRI和BglII位點之間,形成pTREPl。這個啟動子也被Waterfield等人 ((1995),見上文)利用啟動子探針載體pSB292分離和表征。最初根據制造商的說明使用 VentDNA聚合酶PCR擴增Pl啟動子片段,并克隆進pTREX載體作為EcoRI-Bglll DNA片段。 通過限制性內切酶消化,從PTREXl中移出帶有Pl啟動子的EcoRI-Bglll片段,并克隆進 pTREP 中(Schofield 等人,pers. corns. University of Camberidge Dept. Pathology.)。(b) PCR擴增金黃色葡萄球菌(S. aureus) nuc基因金黃色葡萄球菌nuc基因的核苷酸序列(EMBL數據庫登錄號V01281),用于設計進行PCR擴增的合成寡核苷酸引物。設計的引物用于擴增稱為nucA的nuc基因的成熟形式,其由稱為Snase B的分泌型前體肽被蛋白水解切除N末端19到21個氨基酸后生成 (Shortle,(1983),見上文)。設計了三條有義引物(nucSl、nucS2和nucS3,附錄1),每一條引物以相對nuc基因不同閱讀框具有EcoRV或SmaI的平末端限制性內切酶切割位點。另外,有義和反義引物的5'末端分別帶有BglII和BamHI以方便克隆到由BamHI和BglII切割的pTREPl。附錄1中給出了所有引物的序列。使用上述各有義引物結合反義引物PCR擴增三個編碼核酸酶基因成熟形式(NucA)的Nuc基因DNA片段。使用金黃色葡萄球菌基因組DNA模板、Vent DNA聚合酶(NEB)和制造商推薦的條件PCR擴增Nuc基因片段。起始步驟為93V變性2分鐘,然后93°C變性45秒、50V退火45秒、和73°C延伸1分鐘,進行30 個循環(huán),最后步驟為73°C延伸5分鐘。用Wizard clean up column (Promega)純化PCR擴增產物以去除未結合的核苷酸和引物。(a)pTREPl-nuc 載體的構建如(b)部分所述純化的nuc基因片段使用標準條件用BglII和BamHI消化, 并與BamHI和BglII切割的及脫磷酸的pTREPl連接,形成pTREP 1-nuc 1、pTREPl_nuc2 和pTREPl-nUC3系列的報告載體。使用制造商提供的試劑和緩沖液或使用標準條件 (Sambrook和Mani at is,(1989),見上文)進行普通分子生物學技術操作。在各pTREPl_nuc 載體中表達盒包括轉錄終止子、乳球菌啟動子P1、獨特的克隆位點(Bglll、EcoRV或SmaI) 和后續(xù)的nuc基因的成熟形式及第二個轉錄終止子。注意nuc基因翻譯和分泌必需的序列被有意排除在這一結構之外。這些成分只能由合適消化的外源DNA片段(代表靶細菌的) 提供,該片段可被克隆到在nuc基因上游緊鄰的獨特的限制性位點。
在擁有啟動子方面,pTREPl-nuc載體與Poquet等人((1998),見上文)描述的 pFUN載體不同,其用于直接在乳酸乳球菌中直接篩選Nuc的活性來鑒定乳酸乳球菌的輸出蛋白。由于pFUN載體在Mic開放閱讀框架上游沒有啟動子,因此克隆的基因組DNA片段除帶有Nuc翻譯起始和分泌所需的成分外,還必需提供轉錄信號。這一限制可能會阻止遠離啟動子的基因的分離,例如位于多順反子操縱子中的基因。而且不能保證來自其它種類細菌的啟動子在乳酸乳球菌中會被識別和發(fā)揮功能。某些啟動子在天然宿主內可受到嚴緊調控,但在乳酸乳球菌中卻不受這種調控。相反,帶有Pl啟動子的pTREPl-nuc系列載體能保證無啟動子的DNA片段(或DNA片段含在乳酸乳球菌中無活性的啟動子序列)仍被轉錄。
(ii)肺炎鏈球菌分泌蛋白質的篩選從肺炎鏈球菌中分離的基因組DNA用限制性內切酶Tru9I消化。之所以使用這個識別序列為5' -TTAA-3'的酶,是因為它能有效切割富含A/T的基因組并隨機產生在優(yōu)選尺寸范圍(一般平均為0. 5-1. O kb)的基因組DNA片段。這個尺寸范圍是優(yōu)選的,因為使用Pl啟動子轉錄新基因序列的可能性有提高。但是,并非所有情況下都需要Pl啟動子,因為許多鏈球菌的啟動子可能在乳酸乳球菌中被識別。從Tru9I部分消化的肺炎鏈球菌基因組DNA中純化不同大小范圍的DNA片段。由于Tru9I限制性內切酶產生交錯末端, 所以DNA片段在連接到EcoRV或SmaI切割的pTREPl-nuc載體之前必需變?yōu)槠侥┒恕Mㄟ^使用Klenow酶的5' -3'聚合酶活性進行部分填充的酶反應實現(xiàn)這一點。簡言之,Tru9I 消化的DNA溶解在溶液中(一般總體積在10-20 μ 1之間),其補充有Τ4 DNA連接酶緩沖液(New England Biolabs ; NEB) (IX)和 33 μ M 每一種需要的 dNTPs,此處為 dATP 和 dTTP。 加入Klenow酶(1單位Klenow酶(NEB)每μ g DNA),反應在25°C孵育15分鐘。75°C孵育該混合物20分鐘以終止反應。然后加入EcoRV或SmaI消化的pTREPl-nuc質粒DNA (—般在200-400ng之間)。然后在混合物中補充400單位的T4DNA連接酶(NEB)和T4DNA連接酶緩沖液(IX),16°C孵育過夜。連接混合物直接用100%的乙醇和1/10體積的3M醋酸鈉 (pH 5.2)沉淀,用于轉化乳酸乳球菌MG1363(Gasson,1983)?;蛘?,pTREP-nuc載體基因克隆位點中還帶有用于克隆的BglII位點,例如用于克隆Sau3AI消化的基因組DNA片段。乳酸乳球菌轉化克隆在腦心浸液瓊脂上生長,通過覆蓋一層甲苯胺藍-DNA-瓊脂 (0.05M Tris pH 9. 0,每升 10 克瓊脂,每升 10 克 NaCl,0. ImM CaCl2,0. 03% wt/vol 鮭魚精 DNA和90mg甲苯胺藍0染料),可以檢測出核酸酶分泌(Nuc+)克隆,基本上如Shortle等人(Shortle,1983,見上文和Le Loir等人,1994,見上文)所描述。然后平板在37°C孵育 2小時。核酸酶分泌克隆形成易于鑒別的粉紅色暈圈。從Nuc+重組乳酸乳球菌克隆中分離質粒DNA,插入DNA用附錄1中描述的NucSeq測序引物在一條鏈上測序,這直接測序穿過插入的DNA測序。(iii)從肺炎鏈球菌中分離編碼輸出型蛋白質的基因使用核酸酶篩選系統(tǒng)已鑒定出大量推定的編碼肺炎鏈球菌輸出型蛋白質的基因?,F(xiàn)在進一步鑒定它們以去除人為現(xiàn)象。使用幾個參數分析用該篩選系統(tǒng)鑒定的序列。1.用軟件程序 Sequencher (Gene Codes Corporation)禾口 DNAStrider (Marck, Nucleic Acids Res.,16 :1829-1836 (1988)),分析所有推定的表面蛋白質的前導/信號肽序列。細菌信號肽序列有共同的特點。它們的特點是,在短的帶正電的N末端(N區(qū))之前, 緊隨著一段疏水殘基(中段_h區(qū)),然后是帶有切割位點的極性更強的C末端區(qū)(c-區(qū))。利用計算機軟件可給出推定的蛋白質的親水性質,并易于鑒定出前導肽序列典型的非常明顯的疏水區(qū)(h-區(qū))。另外,檢查序列存在或缺失可能的核糖體結合位點(Shine Dalgarno 基序),該位點為推定的Mic報告融合蛋白質翻譯起始所必需。2.使用公開提供的數據庫(OWL-proteins,包括Swissprot和GenBank translations),將所有推定的表面蛋白質序列與全部蛋白質/DNA序列比較。這使我們能鑒定出與已知基因相似的序列或已知某些功能的基因的同源物。因此可預測某些利用LEEP 系統(tǒng)已鑒定出的基因的功能,而且可無疑地確定該系統(tǒng)可用于鑒定和分離表面相關蛋白質的基因序列。所以我們還應該能夠證實這些蛋白質確實是表面相關的,而不是人為現(xiàn)象。 LEEP系統(tǒng)已用于鑒定疫苗和治療用的新基因靶標。3. 一些基因鑒定的蛋白質(Some of the genes identifiedproteins)沒有典型的前導肽序列,也與數據庫中的任何DNA/蛋白質序列無同源性。實際上這些蛋白質可能表明了我們篩選方法的重要優(yōu)點,即,分離非典型的表面相關蛋白質,其可能被前述的基于序列同源性搜索的所有篩選方案或方法錯過。所有實例中,開始僅獲得部分基因序列。表2列出的全長基因均是通過參考TIGR 肺炎鏈球菌數據庫(wwwitigr. org)獲得的。這樣,通過將最初獲得的部分序列與數據庫比較,我們能鑒定出全長基因序列。因此,如此處所述,兩組基因被清楚地鑒定,即,一組基因編碼以前未鑒定的肺炎鏈球菌蛋白質(表1,即圖2),第二組編碼已知的肺炎鏈保持不變化球菌蛋白質,但不知道這些蛋白質可作為抗原(表2,即圖3A-G)。最近又有兩個肺炎鏈球菌基因組被測序并發(fā)表了相關信息,隨后這些信息由NCBI 數據庫提供?!芭R床分離的19F型肺炎鏈球菌基因組序列注釋草圖”由Dopazo等人于2001 年7月發(fā)表(Microbial Drug Resistance,卷7,pp99_125)?!癛6株肺炎鏈球菌基因組,,由 Hoskins 等人于 2001 年 10 月發(fā)表(Journal of Bacteriology,卷 183,pp5709_5717)。通過BLAST分析,從這些基因組中鑒定出了 ID-304L1的同源物,它們都在N末端或近N端有一個高度保守的23個氨基酸的序列MELVLPNNYVV (D,A) I (L) D (E) E (Q) EEMMYLDGG (E),此處括號內的殘基是前面氨基酸的替換。表3(即圖4-B)給出了這些同源物的序列。實施例2肺炎鏈球菌不同分離物中ID-304L變異體的保守性和變異性分析了血清型3的肺炎鏈球菌株ATCC49619中基因ID304L1和ID305的存在情況。 根據表1列出的已知核酸序列設計寡核苷酸引物,PCR擴增這些目的基因。(i)擴增和標記特異目的基因作為DNA印跡分析的DNA探針設計寡核苷酸引物用于擴增相應的基因特異的DNA探針(附錄2)。根據制造商的說明,用Pfu Turbo DNA聚合酶(stratagene)PCR擴增特異的基因靶標(ID304L1和ID305)。 典型反應在50 μ 1體積中進行,包括DNA模板lOOng、十分之一體積的酶反應緩沖液、引物各 100ng、dNTP各200 μ M和1. 25單位的Pfu Turbo DNA聚合酶。典型反應包括95°C起始變性3分鐘,然后是94°C 60秒的單循環(huán),然后50°C 60秒進行30個循環(huán)。然后是72°C 2分鐘的單循環(huán),接著是72°C最后延伸10分鐘。用QIAquick PCR Purification Kit(Qiagen)純化所有 PCR 擴增產物。然后確定 ATCC49619株中ID304L1和ID305同源物的存在。為用作DNA探針,純化從ID304L1中擴增的基因DNA片段,然后根據制造商的說明,用 DIG Nucleic Acid High Prime Labelling Kit (Roche)對其標記地高辛。(ii)DNA印跡雜交分析B組鏈球菌基因組DNA用DNA印跡分析確定由LEEP系統(tǒng)分離的新肺炎鏈球菌基因的交差血清型保守性。
圖1給出了分析中使用的肺炎鏈球菌株。從肺炎鏈球菌中分離基因組DNA,對其進行ID304L1衍生的基因靶標的保守性分析。根據制造商的說明,用HindIII限制性內切酶(Roche)消化合適濃度的DNA,并用瓊脂糖凝膠電泳分析。DNA樣品瓊脂糖凝膠電泳后,凝膠在0. 5M NaOH-1. 5M NaCl中變性20分鐘、在0. 5MTris. HCKpH 7. 5)-1. 5M NaCl里中和40分鐘,然后經過夜毛細印跡將DNA轉移到Hybond N+膜上(Amersham)。該方法基本上如“用于濾膜雜交的地高辛系統(tǒng)用戶使用指南”(Boehringer Mannheim,19%)所描述,在下面貯有20X SSC(檸檬酸鈉鹽)的平臺上, 用Whatman 3匪(濾紙)為芯。濾膜在2 X SSC中短暫漂洗并保存于_20°C。當使用DIG Nucleic Acid Detection Kit時,濾膜用地高辛標記的DNA探針預雜交和雜交,并用Boehringer Marmheim推薦的條件洗滌。濾膜在地高辛“fesyHyb”中于 42°C預雜交一小時。在加入雜交緩沖液(地高辛“fesyHyb”)之前,地高辛標記的DNA探針在100°C變性10分鐘,并于冰上冷卻。在Hykiid小雜交爐的旋轉Hykiid管中,進行雜交過夜。用2XSSC-0. 1% SDS室溫5分鐘的條件洗滌濾膜兩次,可去掉未結合的探針。為提高嚴緊性,濾膜用0. 5XSSC-0. 1% SDS 680C 15分鐘的條件洗滌兩次。使用該DIG Nucleic Acid Detection Kit(Roche)免疫檢測特異結合的地高辛標記DNA探針。DNA印跡雜交顯示,在多數分析的菌株中存在ID-304L1同源物。泳道12,探針從其中擴增,只有一條很弱的條帶,但這歸因于凝膠中只加入了低水平的DNA。這也可用于解釋泳道5沒有條帶的情況,該泳道的背景顯著低于其它泳道。有些菌株出現(xiàn)兩個條帶,這說明可能有一個以上的同源物存在(如在防4和R6株中發(fā)現(xiàn)的那樣)。多數臨床相關菌株中存在此蛋白質的基因,說明它是一個保守性的蛋白質,因此是一個好的疫苗侯選物。附錄I-LEEP篩選的寡核苷酸引物nucSlBgl II Eco RV5 ‘ -cgagatctgatatctcacaaacagataacggcgtaaatag-3‘nucS2Bgl II Sma I5 ‘ -gaagatcttccccgggatcacaaacagataacggcgtaaatag-3‘nucS3Bgl II Eco RV5 ‘ -cgagatctgatatccatcacaaacagataacggcgtaaatag-3‘nucRBam HI5' -cgggatccttatggacctgaatcagcgttgtc-3‘NucSeq5' -ggatgctttgtttcaggtgtatc-3‘PTREPf
5' -catgatatcggtacctcaagctcatatcattgtccggcaatggtgtgggctttttttgttttagc ggataacaatttcacac-3 ‘PTREPe5 ‘ -gcggatcccccgggcttaattaatgtttaaacactagtcgaagatctcgcgaattctcctgtgtggttatccgcta-3'pUCF5' -cgccagggttttcccagtcacgac-3‘Ve5' -tcaggggggcggagcctatg-3‘V15' -tcgtatgttgtgtggaattgtg-3‘V25' -tccggctcgtatgttgtgtggaattg-3‘附錄2-PCR分析和DNA印跡的寡核苷酸引物設計引物以提供后續(xù)克隆中使用的限制性內切酶位點(下面以粗體形式給出)。 下劃線CGC夾(clamps)可使限制性內切酶的結合能力更大。ID 305 Bam5' GGC GGATCC ATA AAC GAA GAA ATA AGC AAG GAA GCID 305 Hind3,GGC AAGCTT TTA GAT TTC TCT GGT CAT ATCID 304 Ll Bam5' GGC GGATCC AAA CAA TTT CAA CTA AGG AGGLID 304 Ll Hind3,GGC AAGCTT TCA TCT TAC TGT CGC AGA TAT G序列表<110>Microbial Technics LimitedProvalis UK limitedLe Page, Richad William FallaBadcock, DanielSizer, Philip James HoldenPeek, KeithWells, Jeremy MarkHanniffy, Sean Bosco<120>分泌型肺炎鏈球菌蛋白質<130>PWC/P32338W0<140>PCT/GB02/01480<141>2002-03-28<150>GB0108079. 5<151>2001-03-30<160>60 <170>PatentIn version 3. 1
<210>1<211>28<212>PRT<213>肺炎鏈球菌<400>1Met Ala Gly Asn Ser Phe His Leu Thr Leu Thr Ser Val Ser Gln Ala151015Gly Gln Gln Thr Leu Arg His Asn His Ser Pro lie2025<210>2<211>84<212>DNA<213>肺炎鏈球菌<400>2atggcaggca attcctttca cctaactctc acttctgtat ctcaggcagg acaacaaacg 60cttcgacaca atcacagtcc tatt84<210>3<211>171<212>PRT<213>肺炎鏈球菌<400>3Met lie Asn Glu Glu lie Ser Lys Glu Ala Gly Gln Ala Ala Gln Thr 151015lie lie Ser Tyr Thr lie Lys Ala Thr Lys Glu Ser lie Asn Leu Glu202530Lys Glu lie Arg Lys Lys Met Asn Glu Thr Leu Glu Lys Ala Asn Gly354045Asn Leu Lys Ser Leu Met Gly Asp Glu Met Lys lie Lys Asp Leu Tyr505560Lys Lys Gly Gln Leu Glu Asn lie Ser lie Asp Gln lie Asp Leu Lys65707580Asp Leu Lys Lys Glu Leu Asn Lys Leu Gly Val Ser Phe Ser Val Met859095Lys Asn Lys Glu Ser Lys Asn Tyr Glu lie Phe Phe Gln Ala Lys Asp100105110lie Lys Val Met Glu Tyr Ala Phe Lys Gln Val lie Ala Lys Glu Asn115120125Lys Lys Glu Lys Glu Ser lie Leu Lys Gln lie Lys Lys Tyr Lys Asp130135140
atgataaacgaagaaataagcaaggaagcaggtcaagcagC 3. C 3.3.3. C C 3. aatatcatac60
acaataaaggcaacaaaagaatcaatcaatttagaaaaagaaataagaaaaaagatgaat120
gaaactttagaaaaagcaaatggaaacttaaaaagtcttatgggcgatgaaatgaaaata180
aaagacctctacaagaaaggacaactagaaaatataagcatagatcaaatcgacctcaaa240
gacttaaaaaaagaactaaacaaacttggagtaagtttctcagtaatgaaaaacaaagaa300
agcaaaaactatgaaatattcttccaagccaaagacataaaagtaatggaatatgccttt360
aagcaagtcatagccaagga3.3.3. 3.3.3.3.3.3.gaaaaagaaagtatcctaaaacaaataaag420
aaatacaaagacctatccaaaaacaaagataagacaaaagaaaaaggaaaaaggaaagta480
aaagaaaaag 3.3.3.3. C C 3.3.3.caaaaaagatatgaccagagaaatc525
Leu Ser Lys Asn Lys Asp Lys Thr Lys Glu 145150
Lys Pro Asn Lys Lys Asp Met Thr Arg Glu 165170
<210>4
<211>525
<212>DNA
<213>肺炎鏈球菌
<400>4
Lys 155 Ile
Gly Lys Arg Lys Val 160
<210>5
<211>189
<212>PRT
<213>肺炎鏈球菌
<400>5
Met 1
Phe
Lys Val Ser
Lys 5
Thr
Glu Asp
Val Leu Leu 20
Ala Phe
Lys lie Thr Leu Phe 10 Gly
Ser Leu Ser Phe
Ser
Lys
50
Ser
Trp
35
Ile
Lys Asn Asn Gly
Leu Pro Gln Ala 25
Gly Gly lie Arg 40
Glu Val Asn lie
Lys Tyr
Thr Ser Ala
Pro 65
Gln Asn Thr Asn
Tyr
55
Glu
Trp Thr Val
Asp Lys Gly
Asp lie Val 115
Arg 100 Val
Phe
85
Phe
lie 70
Leu Ala Glu Glu
Leu His
Glu Ala Lys
Phe Tyr 105 Ser Gly 120
Arg
90
lie
Arg
75
Thr
Ala Phe
Glu Asn 45 Lys Val 60
Leu Asn
Glu
30
Gly
Ala
15
Leu
Gly Lys Val
Val
Pro Tyr Gly
Asn Glu Val Lys 125
Gly Ser Lys
Lys Leu Asp Leu Glu
Tyr 110 Thr
Lys 80 Thr Glu 95
Arg Gly Trp Ser
Thr Lys Val Val Asp Asp Val Tyr Ser Asp Ser Ala Lys Ser Gly Tyr130135140Phe lie Leu Asp Gly Glu Gin lie Leu Glu Ser Ser Trp Asp Ser Val145150155160Asn Glu Ser Tyr lie Ala Thr Leu Pro Thr Val Thr Ser Gly Lys Thr165170175Val Val Ala Trp Arg Glu Lys Gly Thr Leu Asn Leu lie180185<210>6<211>567<212>DNA<213>肺炎鏈球菌<400>6atgaaagtat caaaaaaaat tacactattt agtttgtctt ttgcaggttt tgttttattg 60actttacctc aagcaggaaa ggcttttgaa cttaaagaag actgggcatt taaaggtggc 120attcgatacg agaatgggaa agtcagcaaa attaataatg gatatgaagt aaatattaaa 180gtgttagatt tacctagtac tagcgcaatc gaatggacag ttagattgaa tggagaaaag 240caaaatacta acttcttagc ggaggaaaga actgtatcta aaactgaaga taagggacgt 300ttcttgcact tttatatccc ctatggatat cgtggggata ttgtagtaga ggctaagagt 360ggaaacgaag tgaagacttg gtctactaag gtagttgacg atgtttattc agattctgct 420aagagtggct actttattct cgatggggaa caaatcttag aaagttcatg ggattccgta 480aatgagtctt atattgcaac gcttccaact gtaacatcag gaaaaactgt tgttgcttgg 540cgtgaaaaag gaactcttaa tttaatt567<210>7<211>124<212>PRT<213>肺炎鏈球菌<400>7Met Glu Leu Val Leu Pro Asn Asn Tyr Val Val Leu Glu Gin Glu Glu151015Met Met Tyr Leu Asp Gly Gly Phe Ser lie Pro Arg Trp Pro Val Ala202530Thr Ala lie Asn lie Ala Phe Asn Gly Val Leu Gly Gly Gly Ala lie354045Ser Leu Val Arg Asn Tyr lie Arg Asn Tyr Gly Leu Arg Arg Val Thr505560Ser Ala lie Ala Gly Ala Ala Ala Arg Tyr Val Gly Val Arg Val Ala65707580Asn Arg Val Ala Gly Phe Ala Leu Ser Ala lie Asn Gly Phe Ala Ala
859095Trp Met Ser lie Gly Asp Ala lie Thr Thr lie Trp Ala Asn Asn Asp100105110Val Asn Arg Arg Asp Pro Asn Leu Asn Ala Leu Trp115120<210>8<211>375<212>DNA<213>肺炎鏈球菌<400>8atggaactcg tattaccaaa taattatgtt gttcttgagc aagaagagat gatgtatctt 60gatgggggat tttctattcc gagatggcct gttgcaacag ccattaatat agcttttaat 120ggtgttttag gtggaggagc aatcagtcta gttagaaatt atattcgtaa ttatggtttg 180cggcgagtta caagcgcaat tgctggagca gctgcaagat atgttggggt acgagttgca 240aatagagtgg caggatttgc actgtctgct attaatggat ttgcagcttg gatgtcaatt 300ggcgatgcta ttacaacaat ctgggccaac aatgatgtaa ataggagaga cccaaattta 360aacgccttgt ggtaa375<210>9<211>725<212>PRT<213>肺炎鏈球菌<400>9Met Lys Asp Thr Phe Lys Asn Val Leu Ser Phe Glu Phe Trp Gin Lys151015Phe Gly Lys Ala Leu Met Val Val lie Ala Val Met Pro Ala Ala Gly202530Leu Met lie Ser lie Gly Lys Ser lie Val Met lie Asn Pro Thr Phe354045Ala Pro Leu Val lie Thr Gly Gly lie Leu Glu Gin lie Gly Trp Gly505560Val lie Gly Asn Leu His lie Leu Phe Ala Leu Ala lie Gly Gly Ser65707580Trp Ala Lys Glu Arg Ala Gly Gly Ala Phe Ala Ala Gly Leu Ala Phe859095lie Leu lie Asn Arg lie Thr Gly Thr lie Phe Gly Val Ser Gly Asp100105110Met Leu Lys Asn Pro Asp Ala Met Val Thr Thr Phe Phe Gly Gly Ser115120125lie Lys Val Ala Asp Tyr Phe lie Ser Val Leu Glu Ala Pro Ala Leu
130135140
AsnMet GlyValPheValGlylielieSerGlyPheValGlyAlaThr
145150155160
AlaTyr AsnLysTyrTyrAsnPheArgLysLeuProAspAlaLeuSer
165170175
PhePheAsnGlyLysArgPheValProPheValVallie Leu Arg Ser
180185190
AlalieAlaAlalieLeuLeuAlaAlaPheTrpProValValGlnThr
195200205
GlylieAsnAsnPheGlylieTrplieAlaAsnSerGlnGluThrAla
210215220
ProlieLeuAlaProPheLeuTyrGlyThrLeuGluArgLeuLeuLeu
225230235240
ProPheGlyLeuHisHisMetLeuThrlieProMetAsnTyrThrAla
245250255
LeuGlyGlyThrTyrAsplieLeuThrGlyAlaAlaLysGlyThrGln
260265270
ValPheGlyGlnAspProLeuTrpLeuAlaTrpValThrAspLeuVal
275280285
AsnLeuLysGlyThrAspAlaSerGlnTyrGlnHisLeuLeuAspThr
290295300
ValHisProAlaArgPheLysValGlyGlnMetlieGlySerPheGly
305310315320
lieLeuMetGlyVallieValAlalieTyrArgAsnValAspAlaAsp
325330335
LysLysHisLysTyrLysGlyMetMetlieAlaThrAlaLeuAlaThr
340345350
PheLeuThrGlyValThrGluProlieGluTyrMetPheMetPhelie
355360365
AlaThrProMetTyrLeuValTyrSerLeuValGlnGlyAlaAlaPhe
370375380
AlaMetAlaAspValValAsnLeuArgMetHisSerPheGlySerlie
385390395400
GluPheLeuThrArgThrProlieAlalieSerAlaGlylieGlyMet
405410415
AsplieValAsnPheValTrpValThrValLeuPheAlaValIle Met
420425430
TyrPhelieAlaAsnPheMetlieGlnLysPheAsnTyrAlaThrPro
435440445
GlyArgAsnGlyAsnTyrGluThrAlaGluGlySerGluGluThrSer
450455460
SerGluValLysValAlaAlaGlySerGlnAlaValAsnlielieAsn
465470475480
LeuLeuGlyGlyArgValAsnlieValAspValAspAlaCysMetThr
485490495
ArgLeuArgValThrValLysAspAlaAspLysValGlyAsnAlaGlu
500505510
GlnTrpLysAlaGluGlyAlaMetGlyLeuValMetLysGlyGlnGly
515520525
ValGlnAlalieTyrGlyProLysAlaAsplieLeuLysSerAsplie
530535540
GlnAsplieLeuAspSerGlyGlulielieProGluThrLeuProSer
545550555560
GlnMetThrGluAlaGlnGlnAsnThrValHisPheLysAspLeuThr
565570575
GluGluValTyrSerValAlaAspGlyGlnValValAlaLeuGluGln
580585590
ValLysAspProValPheAlaGlnLysMetMetGlyAspGlyPheAla
595600605
ValGluProAlaAsnGlyAsnlieValSerProValSerGlyThrVal
610615620
SerSerliePheProThrLysHisAlaPheGlylieValThrGluAla
625630635640
GlyLeuGluValLeuValHislieGlyLeuAspThrValSerLeuGlu
645650655
GlyLysProPheThrValHisValAlaGluGlyGlnLysValAlaAla
660665670
GlyAspLeuLeuValThrAlaAspLeuAspAlalieArgAlaAlaGly
675680685
ArgGluThrSerThrValValValPheThrAsnGlyAspAlalieLys
690695700
SerValLysLeuGluLysThrGlySerLeuAlaAlaLysThrAlaVal
705710715720
AlaLysValGluLeu
725
<210>10
<211>2127
<212>DNA〈213〉肺炎鏈球菌 <400>10 ggtaaggctt ggtaagtcta cttgagcaaa ggaggaagct ttgattaacc gatgctatgg gttcttgaag ggggcaactg ttcaacggga ctacttgctg gccaactcac ttgctcttgc ggtggtactt ccactatggc tatcaacact tcattcggta
3H3.C 3- 3Η3.
actgaaccaa cttgttcaag ggttcaatcg atcgttaact ttcatgattc gaaggttcag attatcaacc cttcgtgtaa ggagctatgg gacattttga cttccaagcc gaagtttact tttgctcaaa tctccagttt acggaagcag aaaccattta acagctgact acaaatggtg acagcagttg <210>11
tgatggtagt tcgtgatgat tcggttgggg gggctaaaga gtatcactgg taactacttt ctccagcctt cttacaacaa aacgtttcgt ctttctggcc aagaaactgc catttggtct atgacatttt ttgcatgggt tgttagatac tcttgatggg acaaaggtat tcgaatacat gtgctgcctt agttcttgac tcgtttgggt
3.3Η3Η C 3.3.
aagaaaccag ttcttggtgg ctgttaaaga gtcttgtcat aatctgatat aaatgactga cagtagcaga aaatgatggg caggtactgt gtcttgaagt cagttcatgt tggatgctat atgcaattaa ctaaagtaga
tatcgcggtt taacccaacc ggttatcggt acgtgctggt tacaatcttt
Ctttggtggt
gaacatgggg atactacaac accatttgta agtagttcaa tccaattctt tcaccacatg aactggtgca aacagacctt agtacatcca tgtgattgtt gatgattgca gttcatgttc cgctatggct tcgtacacct aactgttctc ctacgcaact cagcgaagtg acgtgtaaac tgcagataaa gaaaggacaa ccaagatatc agcacaacaa cggtcaagtt tgatggattt gtcaagcatc attggttcac tgctgaagga ccgtgcagca atcagttaag attgtaa
atgccggctg tttgcaccac aaccttcaca ggtgctttcg ggtgtatcag tcaatcaaag gtattcgtag ttccgtaaac gttattcttc acaggtatca gcaccattct ttgactatcc gctaaaggta gtaaacctta gctcgtttca gctatctacc acagctcttg atcgcaacac gacgtcgtaa attgcaatca tttgctgtaa ccagggcgca aaagttgcag atcgttgatg gtaggaaatg ggggttcaag cttgattcag aacactgttc gttgctttgg gcagtagaac ttcccaacaa attggtttgg caaaaagttg ggacgtgaaa ttagaaaaaa
ctggtttgat ttgtcatcac ttttgtttgc ccgctggtct gcgatatgtt ttgctgatta ggattatctc ttcctgatgc gttcagcaat ataacttcgg tgtatggtac caatgaacta ctcaagtatt aaggtactga aagttggaca gtaatgttga caacattctt ctatgtatct acctacgtat gtgctggtat tcatgtactt acggaaacta caggctctca ttgatgcatg cagagcaatg ctatctacgg gtgaaatcat acttcaaaga aacaagtaaa ctgcaaatgg aacatgcttt acacagtaag cagcaggaga cttcaacagt caggttctct
tatctggatt tttggaacgt cacagctctt cggtcaagac tgctagtcaa aatgatcggt tgctgacaag gacaggggtt tgtttactca gcactcattc tggtatggat tatcgcaaac cgaaactgct agctgtaaac tatgactcgt gaaagcagaa tccaaaagct tcctgaaact tcttactgag ggatccagta aaacattgta tggtattgtg tcttgaaggt tctccttgtc agttgtcttc tgcagctaaa
gatttcaatc aggtggaatt cctagccatt tgccttcatc gaaaaatcca ctttatcagt aggttttgta actttcattc cgctgcaatt 600 660 720
60 120 180 240 300 360 420 480 540
780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2127
<211>269
<212>PRT
<213>肺炎鏈球菌
<220>
<221>misc_feature
<222>(37). . (37)
<223>X 是 Asn 或 Asp
<220>
<221>misc_feature
<222X40). · (40)
<223>X 是 Cys 或 kr
<400>11
Met Leu Leu GlnLysGluLeulieProMetlieGluAlaAsnLeuPro
151015
Asn Met Ala TyrAlaGluLysAsplieAlaLysPhePheLeuLysGln
202530
Gln Pro Leu AsnXaaTyrSerXaaLysAlaLeuCysGluTyrLeuAsn
354045
Val Ser Lys AlaThrLeuThrArgPheAlaLysLysCysGlyPheLys
505560
Gly Phe Arg GlnPheliePheLysTyrGlnGluMetlieHisGluLys
65707580
Glu Lys Leu AlaLeuTyrThrGluAlaThrGluLysValLeuSerAsp
859095
Tyr Glu Glu MetLeuArgLysThrTyrThrValLeuAspGluValGln
100105110
Leu Glu Arg lieAlaGluMetlieGluThrAlaGluArgValTyrLeu
115120125
Tyr Gly Lys GlySerSerValLeuAlaLeuGlnGluMetLysMetArg
130135140
Phe Met Arg LeuGlyVallieGlyGluValLeuSerAspGluAspMet
145150155160
lie Leu Trp SerSerLeuLeuLeuAsnGluAsnCysLeuVallieGly
165170175
Ala Ser lie SerGlyGlnThrAsplieValLeuGluGlyLeuGlnLys
180185190
Ala Ala Asp LysGlyAlaLysThrValLeuMetThrThrArgLysPhe
195200205
Asp Glu Glu AspCysPhePheAspGluLeuLeuLeuLeuAlaSerThr22210 Asp His Leu 225
Leu lie Thr
Ser Tyr
Gly 230 Leu
215
Asn Arg
Asp Cys 245
Gln Tyr Tyr Tyr Asn Gln 260
<210>12
<211>810
<212>DNA
<213>肺炎鏈球菌
<400>12
Phe Thr Ile
Ile Ser Asn
Ile 265
Ser Pro 235 Tyr Leu 250
His Lys
220 Gln
Phe Pro lie Leu 240 Arg
Glu Ser Pro Glu Glu
Glu 255atgttactgcaaaaagaactaattccaatgatagaagctaacttaccaaatatggcatat60
gctgaaaaagacattgctaaattcttcttaaaacagcaacctctgaatrattattcatst120
aargcattgtgcgaataccttaatgtatccaaagcaacattgactcgatttgcgaaaaaa180
tgtggttttaaaggttttagacaattcattttcaaataccaagagatgattcatgagaaa240
gaaaagttggcattatatacagaggcaacagaaaaagttttatccgactatgaggaaatg300
ttgagaaaaacttacacggttcttgatgaagttcaacttgagcgtattgctgagatgata360
gaaactgctgagcgtgtatatctctacggtaaaggaagttctgttcttgctttacaagaa420
atgaagatgagatttatgcgtctcggagtgattggtgaagtattatcagacgaggatatg480
attttgtggagtagcttactacttaatgaaaattgccttgtcattggagcatccatttca540
ggtcaaactgatattgtactagaaggtctacaaaaagctgcagataaaggcgctaaaaca600
gttttaatgactacaagaaaatttgacgaagaagattgtttctttgatgaactattgtta660
ttagcttcgaccgatcatctctcgtatggcaatcgcatatcacctcagtttccaatactt720
ttaattacagactgcttattctctaattatctggaaagtccagagagacaatattattac780
aatcaaactattatccataaggaggaataa810
<210>13
<211>462
<212>PRT
<213>肺炎鏈球菌
<400>13
Met Asn Lys Ser Arg 15
lie Leu Leu Ala Leu
Gly Gly
Leu Leu Ala 20 lie
Lys
lie 50
Phe
35
Glu
lie Ala Phe
Leu Gly Gly Lys
Ser Leu Lys
Lys 55
Arg
lie
lie
40
Glu
Gly Arg His Gly 10
Leu Ala lie Ser 25
Tyr Gln Gln Lys
Lys Asp Asp Gln 60
Lys Thr lie
Ser
45
Leu
Cys
30
Phe
Arg
15
Leu
Glu Ser Glu
His Leu Gln Gly
AsnGlnLysGluHisPheArgGlnGlyGlnAlaGluVallieAlaTyr
65707580
TyrProLeuGlnGlyGluLysVallieSerSerValArgGluLeulie
859095
AsnGlnAspValLysAspLysLeuGluSerLysAspAsnLeuValPhe
100105110
TyrTyrThrGluGlnGluGluSerGlyLeuLysGlyValValAsnArg
115120125
AsnValThrLysGlnlieTyrAspLeuValAlaPheLyslieGluGlu
130135140
ThrGluLysThrSerLeuGlyLysValHisLeuThrGluAspGlyGln
145150155160
ProPheThrLeuAspGlnLeuPheSerAspAlaSerLysAlaLysGlu
165170175
GlnLeulieLysGluLeuThrSerPhelieGluAspLysLyslieGlu
180185190
GlnAspGlnSerGluGlnlieValLysAsnPheSerAspGlnAspLeu
195200205
SerAlaTrpAsnPheAspTyrLysAspSerGlnlielieLeuTyrPro
210215220
SerProValValGluAsnLeuGluGlulieAlaLeuProValSerAla
225230235240
PhePheAspVallieGlnSerSerTyrLeuLeuGluLysAspAlaAla
245250255
LeuTyrGlnSerTyrPheAspLysLysHisGlnLysValValAlaLeu
260265270
ThrPheAspAspGlyProAsnProAlaThrThrProGlnValLeuGlu
275280285
ThrLeuAlaLysTyrAspIle Lys Ala Phe Phe Val Leu Gly Lys Asn
290295300
ValSerGlyAsnGluAspLeuValLys Arg lie Lys Ser Glu Gly His
305310315320
ValValGlyAsnHisSerTrpSerHi s Pro lie Leu Ser Gln Leu Ser
325330335
LeuAspGluAlaLysLysGlnlieThr AspThrGluAspValLeuThr
340345350
LysValLeuGlySerSerSerLysLeuMetArgProProTyrGlyAla
355360365
IleThrAspAsplieArgAsnSerLeu AspLeuSerPhelieMetTrp
24
370375380
Asp Val Asp Ser Leu Asp Trp Lys Ser Lys AsnGlu Ala Ser lie Leu
385390 395400
Thr Glu lie Gln Tyr Gln Val Ala Asn Gly Serlie Val Leu Met His
405410415
Asp lie His Ser Pro Thr Val Asn Ala Leu ProArg Val lie Glu Tyr
420425430
Leu Lys Asn Gln Gly Tyr Thr Phe Val Thr liePro Glu Met Leu Asn
435440445
Thr Arg Leu Lys Ala His Glu Leu Tyr Tyr SerArg Asp Glu
450455460
<210>14
<211>1392
<212>DNA
<213>肺炎鏈球菌
<220>
<221>misc_feature
<222>(892).(892)
<223>n是A或沒有核苷酉
<220>
<221>misc_feature
<222>(893).(893)
<223>n是C或沒有核苷酉
<220>
<221>misc_feature
<222>(894) (894)
<223>n是T或沒有核苷酉変
<400>14
atgaataaaagtagactaggacgtggcaga cacgggaaaacgagacatrt attattggct60
ttgattggtattttagcaatttctatttgc ctattaggcggatttattgc ttttaagatc120
taccagcaaaaaagttttgagcaaaagatt gaatcgctcaaaaaagagaa agatgatcaa180
ttgagtgagggaaatcagaaggagcatttt cgtcaggggcaagccgaagt gattgcctat240
tatcctctccaaggggagaaagtgatttcc tctgttaggg agytgataaa tcaagatgtt300
aaggacaagctagaaagtaaggacaatctt gttttctactatacagagca agaagagtca360
ggtttaaagggagtcgttaatcgtaatgtg accaaacaaatctatgattt agttgctttt420
aagattgaagagactgaaaagaccagtcta ggaaaggttcacttaacaga agatgggcaa480
ccttttacacttgaccaactgttttcagat gctagtaaggctaaggaaca gctgataaaa540
gagttgacctccttcatagaggataaaaaa atagagcaag accagagtga gcagattgta600
£1£1£1£1£10 0 ctgaccaagacttgtctgca tggaattttg attacaagga tagtcagatt660
gcaacgaccccgcaggtattagagaccctagctaaatatg atattaaagcgnnnttcttt900
gtgcttgggaaaaatgtttctgggaatgaggacttggtga agaggataaaatctgaaggt960
catgttgttggaaaccatagctggagccatccgattctct cgcaactctctcttgatgaa1020
gctaaaaagcagattactgatactgaggatgtgctaacta aagtgctgggttctagttct1080
aaactcatgcgtccaccttatggtgctattacagatgata ttcgcaatagcttggatttg1140
agctttatcatgtgggatgtggatagtctggactggaaga gtaaaaatgaagcatctatt1200
ttgacagaaattcagtatcaagtagctaatggctctatcg ttttgatgcatgatattcac1260
agtccgacagtcaatgccttgccaagggtcattgagtatt tgaaaaatcaaggttatacc1320
tttgtgaccataccagagatgctcaatactcgcctaaaag ctcatgagctgtactatagt1380
cgtgatgaataa1392
atcctttatc caagtcctgt ggttgaaaat ttagaagaga tagccttgcc agtatctgct ttctttgatg ttatccaatc ttcgtactta ctcgaaaaag atgcggcctt gtaccaatct tactttgata agaaacatca aaaagttgtc gctctaacct ttgatgatgg tccaaatcca
<210>15
<211>101
<212>PRT
<213>肺炎鏈球菌
<400>15
Met 1
Lys
Phe Val Lys
Lys 5
Ala
Gly Asp Lys Val
Gly Thr Glu 20
Glu Gly Val Asn
Val lie Val 35
Leu Pro Gln Gly
Val Val Leu Thr 25
Val Lys Lys His
Arg Val lie Ala Gly Lys Asp 1015
Ala Leu Pro Lys Val Asn Lys
Asn Glu 50
Ser Asn Val Gln
lie
40
lie
Leu Pro Lys Val 30
Arg Pro Thr
lie Glu Lys
Val 65
Gly Tyr Lys Phe
Gly Glu Val
Leu 100
Val
85
Asp
Val
70
Asp
Gly 55
Leu Asp Lys Asn
Gln 45
Ala Ala lie His
Glu 60
Val Ala Gly Arg
Gly Lys Lys
Val 90
Gly 75
Arg Tyr Asn Lys
Lys 95
Val 80 Ser
720 780 840
<210>16
<211>306
<212>DNA
<213>肺炎鏈球菌
<400>16
atgtttgtaa aaaaaggcga caaagttcgc gtaatcgctg gtaaagataa gggaacagaa gctgttgtcc ttactgccct tccaaaagta aacaaagtta tcgttgaagg tgttaacatt
60 120
26
gttaagaaac accaacgtcc aactaacgag■ cttcctcaaggtggtatcat cgagaaagaa180
gcagctatcc acgtatcaaa cgttcaagttttggacaaaa atggtgtagc tggtcgtgtt240
ggatacaaat ttgtagacgg taaaaaagttcgctacaaca aaaaatcagg cgaagtgctt300
gattaa306
<210>17
<211>702
<212>PRT
<213>肺炎鏈球菌
<400>17
MetLysLyslieSerAsnPheCysMetLeuLeuLeuLeuLeuCysThr
151015
ThrPhePheValPheAsnValAsnTyrThrArgGluValValArglie
202530
GlnGluMetGlyLysThrValAspSerLeuAspLeuTyrLeuLysAsp
354045
IleAsnGluProAlaAlaSerValLeuArgPhePheGluAspValSer
505560
LysGluTyrLysValSerlielieLysThrAspSerGlyAspGluVal
65707580
ValLysSerGlyValPheAspLysAspThrPheProTyrGlnGluPhe
859095
GlyIleSerSerLeuAspPheThrThrAspGlyGluGlyValTyrSer
100105110
AsnLysGlulieSerAsnLysLeuGlyThrlieProThrPheLeuLys
115120125
AlaLysProlieGlnLeuMetThrPheGlnThrTyrlieLysAspThr
130135140
SerArgSerLeuAsnGlyArgTyrThrlieThrSerThrGlnGluMet
145150155160
AspLysAspArglieValGlnLysTrpSerAspPhePheLyslieAsp
165170175
GlnAlaThrLeuLeuGluProThrTyrLysSerAlaValGluVallie
180185190
AsnArgAspLeuLeuLeuSerAlalieValPheValLeuAlalieLeu
195200205
LeuLeuValLeuValThrValTyrGlnProMetMetGluMetLysArg
210215220
ValGlyValGlnLysLeuLeuGlyPheGlnAspArgAlaValLeuAla
225230235240
AspValValLysGlyAsnLeuTyrLeuLeuLeuGlyGlyAlaLeuVal
245250255
IleAsnLeuGlyValPhePheLeuLeuAspTyrLysProLysAspLeu
260265270
PheProMetLeuTrpLeuSerHisPheLeuLeuLeuGlnLeuTyrLeu
275280285
PheIleSerTrpLeuThrTyrLeuLeulieGlnLysMetThrlieSer
290295300
SerLeuLeuLysGlyPheSerSerPheLysPheGlyLeuliePheAsn
305310315320
TyrValMetLyslieGlyThrThrlieLeuLeuThrAlaLeuLeulie
325330335
GlyValGlyArgSerLeuGluGlnGluAsnLysGluLeuAlaTyrGln
340345350
GlnGlnTrpValSerGlnGlyAsnTyrLeuThrLeuGluThrPheLys
355360365
LeuAsnAspAsnLeuTrpGlnGluGluLeuAlaGlySerGlyLysSer
370375380
ThrAspTyrPheTyrArgPheTyrGlnAspLeuValGluLysThrGln
385390395400
AlaGlyTyrValGlnSerSerSerLeuProValLysAsnPheValGln
405410415
SerGluGlnlieGlnGlnTyrGlnLeuThrAspThrValAspValTyr
420425430
TyrAlaAsnArgAsnPheLeuLysSerLysGlyPheLysLeuProAsn
435440445
ThrGlylieLysLysVallieLeuMetProAlaSerThrLysGlyGlu
450455460
GluAspLysAsnGlnLeuLeuGlyLysLeulieAlaPheHisSerMet
465470475480
LysTyrGluGluGlnGlnLysArgThrlieGluGluMetAspValGlu
485490495
IleAlaTyrTyrGluGlyAspTrpSerPhePheProTyrSerAspLys
500505510
ArgLysGluAsnLeuSerAsnProlielieSerLeuValAsnAspSer
515520525
AspMetMetTrpAspGluLysAlaSerLeuSerThrThrGlyLeuAsn
530535540
AsnProlieLyslieGluAsnThrValGlnHisGlnLysGlulieThr
545550555560Glu Leu Val Glu Lys Leu Ser Asp Gly Asn Tyr Leu Lys Phe Ser Ser565570575lie Gln Ala lie Gln Gln Glu Lys Val Asp Ser Tyr Arg Asp Ala Val580585590Arg Asn Phe Asn Leu Leu Phe Ala Leu Phe Gly Leu Leu Ser Met Met595600605lie Ser Tyr Phe Leu Leu Val Thr Thr Phe Leu Leu Lys Arg Arg Asp610615620lie lie Thr Lys Lys Phe Met Gly Trp Lys Leu Val Asp Arg Tyr Arg625630635640Pro Leu Leu Val Leu Leu Leu Leu Gly Tyr Ser Phe Pro Leu Leu Val645650655Leu lie Phe Phe Ala His Ala Phe Leu Pro Leu Leu Leu Phe Ala Gly660665670Phe Thr Cys Leu Asp lie Leu Phe Val Leu Gly Leu Ala Ser Arg Met675680685Glu Lys Arg Ser Leu Val Glu Leu Leu Lys Gly Gly lie Leu690695700<210>18<211>2109<212>DNA〈213〉肺炎鏈球菌<400>18atgaaaaaaa tcagtaattt ctgtatgtta ctcctgcttc tgtgtaccac tttttttgtt 60tttaatgtaa actatacacg agaagtggtt cggattcaag aaatgggaaa gactgtagat 120tctttggatt tgtatttgaa agatattaac gaacctgcag cgtctgttct tcgatttttt 180gaggatgtat caaaggagta taaagtctcc atcatcaaaa cagacagtgg tgatgaggtg 240gtcaagtctg gtgtttttga taaagatacc ttcccctacc aagagtttgg gatttcttct 300cttgatttta ccacagatgg tgaaggagtc tatagtaata aagaaatttc caataaactt 360ggtacgattc cgacctttct aaaagccaaa cctattcagc ttatgacttt tcaaacctat 420atcaaggata catctcgtag tttaaatggt cgctatacga taacttctac acaagagatg 480gacaaggata ggattgtaca gaaatggagc gattttttca agatagacca ggctaccttg 540ctagagccga cctacaaaag tgcagtggaa gtcataaatc gagatttgct tttatctgcc 600attgtttttg tcttggctat tttgcttctt gtgttagtga cagtgtatca accgatgatg 660gagatgaaaa gagttggggt acaaaaatta cttggttttc aagatagggc tgttttagct 720gatgttgtaa aaggcaacct ttacctcctc ctaggtgggg ctcttgtgat caatctaggc 780gtgtttttct tgcttgatta taagccaaaa gatttgtttc ctatgctgtg gttgtctcat 840tttttgctgt tgcagcttta tctctttatc agttggttga cttacctctt aatccaaaaa 9000743]atgacaatcagctctctgctgaaaggtttttcatctttcaaatttggtcttatcttcaat9600744]tatgtgatgaaaatagggacaactattttactgacggccttactgattggggtgggcaga10200745]agtttagaacaagaaaacaaagaacttgcttatcagcaacagtgggtaagtcaaggtaat10800746]tacctgaccttagaaaccttcaaactcaatgataatctgtggcaagaagagctagcaggg11400747]tcagggaaatctacagattatttctatcgattttatcaggatttggtagaaaaaacgcag12000748]gcgggctatgtgcagagtagcagtcttcctgtaaaaaattttgtccaatcagaacagatt12600749]cagcaatatcagttaacagatacggtggatgtttactatgccaatcgcaattttctaaag13200750]agcaagggattcaagctaccaaataccggtattaaaaaagttattttgatgccagcaagt13800751]acgaaaggtgaagaagataaaaatcagctcttggggaagttaattgcctttcattcgatg14400752]aagtatgaagagcagcaaaaacgaacgatagaggagatggatgtcgagattgcctattat15000753]gaaggagattggtcatttttcccatatagtgataagcgaaaggaaaatctctccaatcca15600754]attattagcttggtcaatgattctgatatgatgtgggatgagaaagcctccctgtcaaca16200755]actggcttaaataatccgattaaaattgaaaatacggttc3-3-C 3- C3.3H3.agagattaca16800756]gagttagttgagaaattgtcagatggaaattatttaaaattttcatctattcaagccatt17400757]caacaagagaaagtggattcttatcgagatgctgttcggaattttaacctactctttgct18000758]ttgtttggtctccttagcatgatgatttcctacttcttactagtaacaactttcttattg18600759]aagcgcagggatatcattaccaagaagtttatggggtggaaactggtcgatcgctaccgt19200760]cctctcctcgttctgctcttgctgggctatagtttccctcttctagtcttgattttcttt19800761]gcccatgcgttcttaccacttctactgtttgcaggttttacatgtctggatatactattt20400762]gtgctaggcttagcttctaggatggagaaaagaagtctagtagagttattgaaagggggc21000763]atcttatga21090764]<210>190765]<211>4480766]<212>PRT0767]〈213〉肺炎鏈球菌0768]<400>190769]Met Pro lie Thr AlaAla Asp lie Arg ArgGlu Val Lys Glu Lys Asn
0770]
0771]
0772]
0773]
0774]
0775]
0776]
0777]
0778]
0779]
0780]
0781]
1
Val
Thr Phe
Ile 20 Ile
5
Arg Leu Met Phe
Asn Val Glu 35
Asn Lys Val Met Phe Asp
Asn
65
Phe
Lys
50
Glu
Pro Ala Thr Asp 40 Ser
Ser Asp Met
Tyr
70
Glu
Pro Trp Gly Asp 85
Val Tyr Thr Thr Glu Gly
Gly
55
Leu
Asn
Glu
Tyr Gly Pro
Ser
25
Glu
Ser
Pro
Ser
Phe
10
Asp lie
Gln Leu Asp lie Glu
Leu Gly Thr 30 Val
Asp Leu
75 Val Ala 90
Ala Gly
Gly 60 Asp
Gly
Asp
Lys
45
Phe
Thr
Leu
Pro
Val Trp lie Arg
15
Met Lys
Leu Ser
Arg lie
Thr Val 80 Cys Asp 95
Gly Asn0782]1001051100783]LeuLysArgAlaLeuArgHisMetGluGluValGlyPheLysSerPhe0784]1151201250785]AsnLeuGlyProGluProGluPhePheLeuPheLysLeuAspGluAsn0786]1301351400787]GlyAspProThrLeuGluValAsnAspLysGlyGlyTyrPheAspLeu0788]1451501551600789]AlaProThrAspLeuAlaAspAsnThrArgArgGlulieValAsnVal0790]1651701750791]LeuThrLysMetGlyPheGluValGluAlaSerHisHisGluValAla0792]1801851900793]ValGlyGlnHisGlulieAspPheLysTyrAspGluValLeuArgAla0794]1952002050795]CysAspLyslieGlnliePheLysLeuValValLysThrlieAlaArg0796]2102152200797]LysHisGlyLeuTyrAlaThrPheMetAlaLysProLysPheGlylie0798]2252302352400799]AlaGlySerGlyMetHisCysAsnMetSerLeuPheAspAlaGluGly0800]2452502550801]AsnAsnAlaPhePheAspProAsnAspProLysGlyMetGlnLeuSer0802]2602652700803]GluThrAlaTyrHisPheLeuGlyGlyLeulieLysHisAlaTyrAsn0804]2752802850805]TyrThrAlalieMetAsnProThrValAsnSerTyrLysArgLeuVal0806]2902953000807]ProGlyTyrGluAlaProValTyrlieAlaTrpAlaGlyArgAsnArg0808]3053103153200809]SerProLeuValArgValProAlaSerArgGlyMetGlyThrArgLeu0810]3253303350811]GluLeuArgSerValAspProMetAlaAsnProTyrValAlaMetAla0812]3403453500813]ValLeuLeuGluValGlyLeuTyrGlylieGluAsnLyslieGluAla0814]3553603650815]ProAlaProlieGluGluAsnlieTyrlieMetThrAlaGluGluArg0816]3703753800817]LysGluAlaGlylieThrAspLeuProSerThrLeuHisAsnAlaLeu0818]3853903954000819]LysAlaLeuThrGluAspGluValValLysAlaAlaLeuGlyAspHis0820]405410415
31lie Tyr Thr Ser Phe Leu 420
Ala Thr Phe Val Ser Gln 435
〈210>20
<211>1347
<212>DNA
〈213〉肺炎鏈球菌
<400>20
Glu Ala Lys 425
Trp Glu Ile 440
Arg lie Glu Trp Ala Ser Tyr 430
Asp Leu Tyr
Asp Asn Tyr
Leu 445
atgccaatca cgtcttatgt gaacagttag tttgtacgta ttcccttggg gaaggtgaac gaagaagttg ttggatgaaa gcacctactg ggatttgaag aagtacgatg accattgctc gctggatcag tttgatccaa ggtttgatca aaacgtttgg tcgccacttg gtggatccaa ggtattgaaa gcagaagagc aaagctttga ttccttgaag attgataatt <210>21 〈211>84 <212>PRT 〈213〉肺炎鏈球菌 <400>21
Met Val Tyr Leu Val 15
cagctgcaga tctcagatat ataaggtctt tcaatgagtc gagatgaaaa catttgcggg gattcaaatc atggggaccc accttgcgga tagaagcgag aagttctccg gcaaacacgg gtatgcactg atgatccaaa agcatgctta ttccaggtta tgcgcgtacc tggcgaaccc ataaaatcga gcaaggaagc cagaagatga ccaaacgaat atttagacct
tattcgtcgt tttgggaacc gtcgaacaag ggatatgtac tggaagtgtt tgaccctcgt cttcaacctt aacacttgaa caacacacgt tcaccacgag tgcttgtgat actttacgca taatatgtcc aggaatgcag caactatact tgaagcgcct tgcttcacgt ttacgttgct agcaccagct tggtattaca agtggttaaa cgaatgggca ttactaa
gaagtcaagg atgaaaaacg gttatgtttg ttgtacccgg gcaggtctga ggtaatttga ggtccagagc gtgaatgaca cgtgagattg gttgcggttg aagattcaaa acatttatgg ttgtttgatg ttgtcagaaa gccatcatga gtttacattg ggtatgggaa atggctgttc cctatcgaag gaccttccat gctgctctcg agttatgcaa
aaaaaaatgt tcgaaattcc atggatcttc acttggatac tctgtgatgt aacgagctct cagaattctt agggtggcta tgaatgtctt gacagcatga tctttaagct cgaagccaaa cagaaggaaa cagcttacca acccaacagt cttgggctgg ctcgtcttga ttttggaagt
3.3Η3. 3- C S
caactcttca gagatcacat ccttcgtttc
atttggtatt taacgccttc tttcctaggc taactcatac tcgtaaccgt gttgcgttca tggtttgtat catcatgaca caacgctttg ctatactagc acaatgggaa
tacctttatt tgctacagat tattgaaggt atggacagtc ytatacaaca tcgtcacatg cctatttaag ctttgacttg gaccaaaatg gattgacttt tgttgttaaa 720 780
840 900 960 1020 1080 1140 1200 1260 1320 1347
60 120 180 240 300 360 420 480 540 600 660
Leu Gly lie Leu Leu 10
Leu Leu Leu Tyr Val Phe 15
32
Ala Thr Pro Glu Ser lie Lys Gly Thr Val Asn lie Val Ala Met Val202530Cys lie Leu Val Ala Leu Leu lie Leu Leu Val Leu Ser Phe Leu Lys354045lie Phe Gln Leu Pro Thr Glu lie Phe Leu Ala lie Ala Met Leu lie505560Leu Ala Tyr Phe Ser Val Arg Asp lie Thr Leu Met Pro Val Lys Lys65707580Ser Lys Arg Arg<210>22<211>255<212>DNA<213>肺炎鏈球菌<400>22atggtctatt tagtcctagg aattttactg ctcctactct atgtatttgc gacaccagaa 60agcattaaag ggactgtcaa tatcgtcgct atggtatgta ttttagtggc actcttgatt 120ttattggttc tatcttttct gaaaattttt caattaccaa cagaaatatt cctagcaata 180gccatgttga tcctagctta ctttagtgtt agagacatca cactcatgcc agtcaaaaaa 240agtaaaagaa gataa255<210>23<211>779<212>PRT<213>肺炎鏈球菌<400>23Ser Gly Leu Gly Leu Asn Phe Tyr Ala Leu Ser Ser Tyr Tyr Leu Gly151015Ser Phe Leu Ala Pro Leu Val Tyr Phe Phe Asp Leu Thr Asn Met Pro202530Asp Ala lie Tyr Leu Thr Thr Leu Leu Lys Phe Gly Leu lie Gly Leu354045Ser Thr Phe Phe Ser Leu Asn Lys Leu Phe Gln Ser lie Pro Gln lie505560Leu Lys Leu Ala Leu Ser Thr Ser Tyr Ala Leu Met Ser Phe Thr Val65707580Ser Gln Leu Glu lie Lys Thr Trp Leu Asp Val Phe lie Leu lie Pro859095Leu lie lie Thr Gly Leu His Leu Leu lie Thr Glu Lys Lys Leu Leu100105110Leu Tyr Phe Thr Ser Leu Ser lie Leu Phe lie Gln Asn Tyr Tyr Phe
115120125
GlyTyrMetThrValLeuPheLeuliePheTrpTyrLeuCysGlnlie
130135140
SerTrpAspPheLysThrArgLysSerSerValLeuAspPhelieVal
145150155160
IleSerPheLeuAlaGlyMetAlaSerLeulieMetThrLeuProThr
165170175
LeuPheAspLeuGlnThrHisGlyGluLysLeuThrGluValThrLys
180185190
PheGlnThrGluSerSerTrpTyrLeuAspLeuPheAlaLysGlnPhe
195200205
IleGlySerPheAspThrThrLysTyrGlyAlalieProMetliePhe
210215220
ValGlyLeuPheProPhelieLeuThrlieLeuPhePheThrLeuLys
225230235240
SerlieLysPheHisValLysLeulieTyrValliePhePheAlaPhe
245250255
LeulieAlaSerPheTyrlieGluAlaLeuAspLeuPheTrpGlnGly
260265270
MetHisThrProAsnMetPheLeuHisArgTyrAlaTrpliePheSer
275280285
ThrLeuLeulieTyrThrAlaAlaGluValLeuLysArgLeuLysGlu
290295300
LeuLysValTrpAsnPheLeuValSerLeuPheLeuValValAlaGly
305310315320
PheLeuAlaThrlieTyrLeuLysSerHisTyrSerLeuThrAspLeu
325330335
AsnlieLeuLeuThrLeuGluPheLeuValValTyrSerLeuLeuLeu
340345350
LeuAlaVallieLysLysPhelieSerValAsnLeuPheAlalieLeu
355360365
IleSerLeuPhelieLeuValGluMetSerLeuAsnAlaSerSerGln
370375380
MetAspGlylieAlaLysGluTrpGlyPheAlaSerArgSerAlaTyr
385390395400
SerArgAsplieProAlaMetGluSerPheSerThrTyrlieGlyAsn
405410415
GlnPheThrArgThrGluLysLeuGlnThrGlnThrGlyAsnAspSer
420425430
MetLysPheAsnTyrAsnGlyIle Ser Gln Phe Ser Ser Val Arg Asn
435440445
ArgSerSerSerSerThrLeuAspLysLeuGlyPheLysSerSerGly
450455460
ThrAsnLeuAsnLeuArgTyrAlaAsnAsnSerlieLeuAlaAspSer
465470475480
LeuPheGlylieGlnTyrAsnlieSerAspSerProlieAspLysTyr
485490495
GlyPheLysAsplieTyrGlnLysAspAsnLeuThrLeuTyrGluAsn
500505510
GlnTyrSerLeuProlieAlaValAlaSerGlnSerValTyrAsnAsp
515520525
ValLysPheAsnGluHisThrLeuAspAsnGlnAlaSerPheLeuAsn
530535540
GlnLeuAlaAsnValAsnPheAspTyrPheSerProlieProTyrGlu
545550555560
LysThrGluLyslieGluAsnThrAsnAspLeulieSerValThrSer
565570575
SerSerAsnGluAspAlaAlalieGlnTyrGlnlieGluValProGlu
580585590
AsnSerGlnValTyrLeuSerPhelieAsnLeuHisPheSerAsnAsp
595600605
LysGlnLysLysValAsplieLeuValAsnGlyGluLysLysThrPhe
610615620
ThrThrAspAsnValPheSerPhePheAsnLeuGlyTyrThrLysGlu
625630635640
LysLysThrPheAsnlieAsnValSerPheProGlyAsnSerGlnVal
645650655
SerPheGluSerProThrPheTyrArgLeuAspThrLysThrPheThr
660665670
GluAlalieGlnLyslieLysGluGlnProValThrValSerThrSer
675680685
LysAsnLysValPheAlaThrTyrAspValGlnGlnAspThrSerlie
690695700
PhePheThrlieProTyrAspLysGlyTrpSerAlaTyrGlnAspGly
705710715720
LysLyslieGlulieLysGlnAlaGlnThrGlyPheMetLysValAsp
725730735
IleProLysGlyLysGlyThrlieThrLeuSerPhelieProAsnGly
740745750Phe lie Thr Gly Ala lie Cys Ser Phe Thr Ser Leu Leu Leu Phe Gly755760765lie Tyr Asn His Arg Arg Lys Ser Ser Lys Ala770775<210>24<211>2343<212>DNA〈213〉肺炎鏈球菌<400>24agtggtctag ggctaaactt ctatgcccta tctagttatt acttgggtag ttttctcgcg 60cctctggttt acttttttga tctaacgaat atgccagatg ctatctatct gacaactctc 120ttaaaatttg gattgattgg tctgtcaacc ttttttagtt tgaataaatt gtttcaatct 180atccctcaga ttttaaaact agccttatct acttcctatg ctctgatgag tttcactgtc 240agtcaattag agataaaaac ctggctagat gtttttatct tgattccttt aattataact 300ggtttacatc tactgataac tgaaaagaaa ctcctattgt actttacaag tctgtcaatc 360ttatttattc aaaattatta ttttggatat atgacagtat tgtttcttat tttctggtat 420ctctgtcaaa tttcgtggga ctttaagact cgaaaatcat ctgttcttga tttcatagtt 480atctcctttt tagctggtat ggctagtttg attatgactc ttcccactct atttgattta 540cagacacatg gggaaaaatt gactgaagtt acaaagtttc aaactgaaag tagctggtat 600cttgatctct ttgctaagca attcattggt tcctttgaca caacaaagta tggggccatc 660ccaatgattt ttgttggact atttcccttt attttgacca ttttattttt tacgctgaaa 720tctattaagt ttcacgtgaa actcatatat gtaatattct ttgcatttct aattgcaagc 780ttttacatag aagctcttga cttattttgg caaggcatgc atactccaaa catgttttta 840catcgctatg cttggatttt ctctaccttg ttaatttaca cagcagcaga agtcttaaag 900cgtctgaaag aacttaaagt ctggaatttt ttagtttcgc tttttcttgt agtagcagga 960tttttagcta ccatctatct aaaatcgcat tattcttttt taacagattt gaatattctg 1020cttactcttg aatttttggt tgtctattct cttttactcc ttgcagttat caaaaagttt 1080atatctgtga atctatttgc cattctaatc tctttattta tactggttga aatgagttta 1140aatgcttcat ctcaaatgga cggaattgct aaggaatggg gatttgcttc tcgaagtgct 1200tatagtcgag atatcccagc tatggaatct ttctcaacat atattggaaa tcaatttact 1260cgtactgaaa aactacaaac tcagacagga aatgacagta tgaaattcaa ctacaatgga 1320atctctcaat tttcatctgt tcgaaatcgt tcatcaagct ctactttaga taaacttggt 1380tttaaatcct ctgggactaa tctcaatctc cgatatgcaa ataatagtat tttggctgat 1440agtttatttg gtatccagta caatatctca gacagtccta ttgataagta tggctttaaa 1500gatatctatc aaaaagataa tcttacccta tatgaaaatc aatactctct tccgattgca 1560gttgcgagtc aatctgttta caatgatgtc aagttcaatg aacatacctt ggataatcag 1620gcctcatttt taaatcaact tgctaacgtc aattttgatt atttttctcc aataccttat 1680gaaaaaacag aaaaaataga aaatactaat gatttgatta gtgtcacaag ttcttcaaat 1740[1016]gaagatgcagcaatccagta tcaaattgaa gttccagaaa acagccaagt ttatctctct1800[1017]ttcataaaccttcacttttc taacgataaa caaaagaaggttgacatcct tgtaaatggt1860[1018]gaaaaaaagacttttacaactgataatgtc ttctccttct ttaatctagg atatactaaa1920[1019]gagaaaaaaactttcaatatcaatgttagt ttccctggaa attcacaagt atcatttgaa1980[1020]tctcctaccttctatcgttt agataccaaa actttcaccg aggcaattca aaaaattaaa2040[1021]gaacaacctgtcacagtatcaacttctaaa aacaaggttt ttgctacata tgatgtccaa2100[1022]caagatacatctattttcttcaccattcct tatgacaaag gttggtctgc ctaccaagat2160[1023]ggtaagaaaatagaaattaa acaagctcaa actggattta tgaaagttga cattcccaag2220[1024]gggaaaggaactattacactttccttcatt cccaatggtt ttattactgg agcaatctgt2280[1025]tcctttacttctctcttact atttggaatc tataatcacagacgaaagtc atctaaggca2340[1026]taa2343[1027]<210>25[1028]<211>423[1029]<212>PRT[1030]<213>肺炎鏈球菌[1031]<220>[1032]<221>misc_feature[1033]<222X27)..(27)[1034]<223>X 是 Pro 或 Thr[1035]<220>[1036]<221>misc_feature[1037]<222>(28)..(28)[1038]<223>X 是 Gln 或 Lys[1039]<400>25[1040]Met Asn Glu LysValPheArgAsp Pro ValHisAsnTyrlieHisVal[1041]151015[1042]Asn Asn Gln IlelieTyrAspLeu lie AsnXaaXaaGluPheGlnArg[1043]202530[1044]Leu Arg Arg IleLysGlnLeuGly Thr SerSerTyrThrPheHisGly[1045]354045[1046]Gly Glu His SerArgPheSerHis Cys LeuGlyValTyrGlulieAla[1047]505560[1048]Arg Arg lie ThrGluliePheGlu Glu LysTyrProGluGluTrpAsn[1049]65707580[1050]Pro Ala Glu SerLeuLeuThrMet Thr AlaAlaLeuLeuHisAspLeu[1051]859095[1052]Gly His Gly AlaTyrSerHisThr Phe GluHisLeuPheAspThrAsp[1053]100105110[1054]His Glu Ala lieThrGlnGluIle lie Gln Asn Pro Glu Thr Glulie1055]1151201251056]HisGlnValLeuLeuGlnValAlaProAspPheProGluLysValAla1057]1301351401058]SerVallieAspHisThrTyrProAsnLysGlnValValGlnLeulie1059]1451501551601060]SerSerGlnlieAspAlaAspArgMetAspTyrLeuLeuArgAspSer1061]1651701751062]TyrPheThrGlyAlaSerTyrGlyGluPheAspLeuThrArglieLeu1063]1801851901064]ArgVallieArgProlieGluAsnGlylieAlaPheGlnArgAsnGly1065]1952002051066]MetHisAlalieGluAspTyrValLeuSerArgTyrGlnMetTyrMet1067]2102152201068]GlnValTyrPheHisProAlaThrArgAlaMetGluValLeuLeuGln1069]2252302352401070]AsnLeuLeuLysArgAlaLysGluLeuTyrProGluAspLysAspPhe1071]2452502551072]PheAlaArgThrSerProHisLeuLeuProPhePheGluLysAsnVal1073]2602652701074]ThrLeuThrAspTyrLeuAlaLeuAspAspGlyValMetAsnThrTyr1075]2752802851076]PheGlnLeuTrpMetThrSerProAspLyslieLeuAlaAspLeuSer1077]2902953001078]HisArgPheValAsnArgLysValPheLysSerlieThrPheSerGln1079]3053103153201080]GluAspGlnAspGlnLeuThrSerMetArgLysLeuValGluAsplie1081]3253303351082]GlyPheAspProAspTyrTyrThrAlalieHisLysAsnPheAspLeu1083]3403453501084]ProTyrAsplieTyrArgProGluSerGluAsnProArgThrGlnlie1085]3553603651086]GlulieLeuGlnLysAsnGlyGluLeuAlaGluLeuSerSerLeuSer1087]3703753801088]ProlieValGlnSerLeuAlaGlySerArgHisGlyAspAsnArgPhe1089]3853903954001090]TyrPheProLysGluMetLeuAspGlnAsnSerliePheAlaSerlie1091]4054104151092]ThrGlnGlnPheLeuHisLeu1093]420[1094]〈210>26<211>1270<212>DNA〈213〉肺炎鏈球菌<400>26atgaacgaaa aagtattccg tgaccctgtt cacaactaca tccatgtcaa taatcaaatc 60atctatgact tgattaatmc amaagaattt cagcgtttgc gccggatcaa acaactggga 120acttccagtt ataccttcca cggtggagaa cacagtcgct tctctcactg tctaggagtc 180tatgaaattg cacgacgcat cacagagatt ttcgaagaaa aatatcctga ggaatggaat 240cctgccgagt ctctcttgac catgaccgct gctctcctac acgaccttgg gcatggtgcc 300tactcccata cttttgaaca tctctttgat acagaccatg aagccattac tcaggagatt 360attcaaaatc ctgagacaga gattcaccaa gtcctgctac aagtggcacc tgatttccca 420gaaaaggtgg ccagtgtcat tgaccatacc tatcctaata agcaggtcgt gcagctcatt 480tctagtcaga ttgacgcaga tcgcatggac tatctcttgc gcgactccta ttttacagga 540gcatcctatg gggaatttga cctgactcga atcctccgag tcattcgtcc tatcgaaaat 600ggtatcgcct ttcagcgcaa tggcatgcac gccatcgaag actacgtcct cagtcgctac 660cagatgtaca tgcaggttta tttccacccc gcaacacgcg ccatggaagt tctcctacag 720aatcttctca aacgcgccaa ggaactctat cctgaggaca aggatttctt tgcccgaact 780tctccacacc tcctgccttt cttcgaaaaa aatgtgacct tgactgacta tctggctctg 840gatgatggcg tgatgaatac ctacttccag ctttggatga ccagtcctga caagattctt 900gcagatttat cgcatcgctt tgtcaaccgc aaggtcttta aatccattac cttttcacaa 960gaggaccaag atcaacttac tagcatgaga aaattggttg aggatatcgg ctttgatccc 1020gactactaca ctgccattca taagaacttt gacctccctt atgatatcta tcgtcccgaa 1080tctgaaaacc cacggacaca gattgagatt ttacaaaaaa atggagaact ggccgaactc 1140tctagcctgt ctcctatcgt ccaatccctt gctggcagtc gccacggaga taatcgcttt 1200tattttccaa aagaaatgtt ggaccaaaac agcatctttg caagcattac ccagcaattt 1260ttacacttga1270<210>27<211>53<212>PRT〈213〉肺炎鏈球菌〈400>27Met Asn Pro Ser Leu Glu Asp lie Asn Ala Thr lie Ala Thr Gly Tyr151015Ser Ser Asp Thr Ala lie Lys Glu Ser lie Asp Phe Phe Gln Asn Arg202530Thr Gln Thr Phe Leu Thr Asn Asn His Ala His Leu Glu His Thr Thr354045Lys Glu Val Arg Cys[1133]50<210>28<211>162<212>DNA<213>肺炎鏈球菌<400>28atgaatccca gcttggagga tatcaatgca accatagcca ctggatacag ctcggacacg 60gccatcaaag agagcattga tttcttccaa aaccgaactc aaacgttcct120catgctcatc ttgagcacac caccaaagag gtcagatgtt aa162<210>29<211>36<212>PRT<213>肺炎鏈球菌<400>29Met Leu His Leu Lys Leu Val Lys Gln15Ala Ser Val Glu Ala Trp lie lie Ser2025Tyr Arg His lie35<210>30<211>111<212>DNA<213>肺炎鏈球菌<400>30atgctacact taaaattagt aaaacaagaa atagaagctg aaaagccagc atctgtagaa 60gcttggatca tttccgtcaa atttaaaaaa ggttgctacc gacatatata g111<210>31<211>126<212>PRT<213>肺炎鏈球菌<400>31Met Glu Leu Val Leu15Met Met Tyr Leu Asp20Arg Gly Ser Phe Ala35Gly Gly Ala Thr lie
Glu lie Glu Ala Glu Lys Pro 1015
Val Lys Phe Lys Lys Gly Cys 30
Pro Asn Asn Tyr Val Ala Leu Glu Gln Glu Glu
1015
Gly Gly Gly Val Gly Arg Asn Trp Trp Asn Ser
2530
Thr Val Leu Asp Val Asp Leu Ala lie Tyr Ser
4045
Tyr Ser Ala Tyr Ala lie Lys Lys Ala lie Ser1172]
1173]
1174]
1175]
1176]
1177]
1178]
1179]
1180] 1181] 1182]
1183]
1184]
1185]
1186]
1187]
1188]
1189]
1190]
1191]
1192]
1193]
1194]
1195]
1196]
1197]
1198]
1199]
1200] 1201] 1202]
1203]
1204]
1205]
1206]
1207]
1208]
1209]
1210]
50
Ala Asn 65
His Val Ala Leu Ala Asp
Arg Gly Ala Gly Ser Thr
Ala
85
Thr
Ile
70
Ala
55
Thr Arg Thr Leu
Val 100
Ala Asp
Gly Gly Ser
Gly His Leu Phe
Ser Leu 105 Leu Asp 120
Val
90
Gly
Arg
75
Asn
Trp 115 <210>32 <211>381 <212>DNA <213>肺炎鏈球菌 <400>32
atggaactcg tattaccaaa taattatgtt
gatgggggtg gtggtggtcg taactggtgg
gatgtagatt tggccatcta tagtggtggt
aaagctatct cagctaatag aggggctatt
catgtaggta gtgcagctgg ccatttagtc
actggatttt cactaggtgg agcaatcgca
gatggttata tttttgctta a
<210>33
<211>124
<212>PRT
<213>肺炎鏈球菌
<400>33
Gly Gly Tyr
Met 1
Met
Thr
Ser
Ser
65
Asn
Glu
Met
Ala
Leu
50
Ala
Leu Val Tyr
Arg Trp Met
lie
35
Val
lie
Val
Ser
Leu 20 Asn
Arg
Ala
Ala
lie
Leu 5
Asp lie Asn Gly
Pro
Gly
Ala
Tyr
Ala
70
Phe
Gly 85
Gly Asp
Asn
Gly
Phe
lie
55
Ala
Ala
Ala
Asn Tyr Val 10 lie
Phe Ser
25 Asn Gly 40
Arg Asn Ala Arg Leu Ser lie Thr
Val
Tyr
Tyr
Ala
90
Thr
60
Ser
Thr Ala lie
Leu lie lie
Ala Leu lie
Lys
80
Val
Phe 125
Ala 110 Ala
Asn 95
Tyr Gly
gctcttgagc aatagtagag gcaacaattt acgagaacat aatactgcac tatggggctg
aagaagagat gtagttttgc attctgctta tacgtagttt taaacgttgc agtgggctga
gatgtatctt60
aacagttctg120
tgcgataaaa180
aataattaaa240
actaactgtt300
cggtagctta360 381
Ala
Leu
Leu
Gly
Val
75
lie
Leu
Arg
Gly
Leu
60
Gly
Glu Gln Trp
Asn lie Trp
Gly
45
Gly
Val
Gly
Ala
Pro
30
Gly
Arg
Arg
Phe
Asn
Glu
15
Val
Ala
Val
Val
Glu
Ala
lie
Thr
Ala 80 Ala
Ala 95
Asn Asp
41[1211]100105110Val Asn Arg Arg Asp Pro Asn Leu Asn Ala Leu Trp115120<210>34<211>375<212>DNA<213>肺炎鏈球菌<400>34atggaactcg tattaccaaa taattatgtt gctcttgagc aagaagagat gatgtatctt 60gatgggggat tttctattct gagatggcct gttgcaacag ccattaatat agcttttaat 120ggtgttttag gtggaggagc aatcagtcta gttagaaatt atattcgtaa ttatggtttg 180gggcgagtta caagcgcaat tgctggagca gctgcaagat atgttggggt acgagttgca 240aatagagtgg caggatttgc actgtctgct attaatggat ttgcagcttg gatgtcaatt 300ggcgatgcta ttacaacaat ctgggccaac aatgatgtaa ataggagaga cccaaattta 360aacgccttgt ggtaa375<210>35<211>117<212>PRT<213>肺炎鏈球菌<400>35Met Glu Leu Val Leu Pro Asn Asn Tyr Val Val lie Asp Glu Glu Glu151015Met Met Tyr Leu Asp Gly Gly Ala Tyr Leu Ser Lys Arg Ala Cys Gln202530Gly lie Cys Ala Ala Leu Ala Met Ser Pro Gly Thr Phe lie Ala Leu354045Ala Gly Ala Ala Val Leu Thr Lys Lys Leu lie Asn Tyr lie Lys Val505560Gly Gly Leu Gly Gly Trp Leu lie Gly Ala Ala Ala Gly Val Leu Ala65707580Gly Ala Ala Gly Arg lie Ala Tyr Cys lie Gly Tyr Gly Ala Leu Asn859095Arg Gly Cys Asp lie Ser Gly Asn Pro Tyr Pro Trp Asp Gly Phe lie100105110Ser Ala Thr Val Arg115<210>36<211>354<212>DNA[1250]<213>肺炎鏈球菌<400>36atggaacttg tattaccaaa taattatgtt gtgattgatg aagaagagat gatgtacctt 60gatgggggag cttatttaag caagcgtgct tgtcaaggaa tttgcgcagc tttagctatg 120agtccaggaa cttttatagc attagctgga gctgcagttt taaccaaaaa actaataaac 180tatattaaag ttggaggcct tggaggttgg cttattggtg cagcagcagg tgtattggct 240ggggcggcag gaagaatagc ttactgtatt ggatatggtg ctcttaatag aggttgtgat 300attagcggga acccttatcc ttgggatgga ttcatatctg cgacagtaag atga354<210>37<211>117<212>PRT<213>肺炎鏈球菌<400>37Met Glu Leu Val Leu Pro Asn Asn Tyr Val Val lie Asp Glu Glu Glu151015Met Met Tyr Leu Asp Gly Glu Ala Tyr Leu Ser Lys Arg Ala Cys Gin202530Gly lie Cys Ala Ala Leu Ala Met Ser Ser Gly Thr Phe lie Ala Leu354045Ala Gly Ala Ala Val Leu Thr Lys Lys Leu lie Asn Tyr lie Lys Val505560Gly Gly Leu Gly Gly Trp Leu lie Gly Ala Ala Ala Gly Val Leu Ala65707580Thr Ala Ala Gly Lys lie Ala Tyr Tyr lie Gly Tyr Gly Val Leu Asn859095Arg Gly Cys Asp lie Asn Gly Asn Pro Tyr Pro Trp Asp Gly Phe lie100105110Ser Ala Thr Val Arg115<210>38<211>363<212>DNA<213>肺炎鏈球菌<400>38atggaacttg tattaccaaa taattatgtt gtgattgatg aagaagaaat gatgtatctt 60gatggggaag cttatttaag caagcgtgct tgtcaaggaa tttgcgcagc tttagctatg 120agttcaggca cttttatagc attagctgga gctgcagttt taaccaaaaa actaataaac 180tatattaagg ttggaggtct tggaggctgg cttattggtg cagcagcagg tgtattggct 240acagcagcag ggaaaatagc ttactatatt ggatatggtg ttcttaatag aggttgtgat 3001289
1290
1291
1292
1293
1294
1295
1296
1297
1298
1299
1300
1301
1302
1303
1304
1305
1306
1307
1308
1309
1310
1311
1312
1313
1314
1315
1316
1323
1324
1325
1326
1327
attaacggga acccttatcc ttgggatgga ttcatatctg tag
<210>39
<211>128
<212>PRT
<213>肺炎鏈球菌
<400>39
cgacagtaag atgagtaatg 360
363
Met 1
Pro
Lys Gln Phe
Asn Asn Tyr 20 Tyr
Gln 5
Val
Leu Arg Arg Arg
Lys 10 Glu
Gln Met Glu Leu
Glu Met Met
Gly Gly Ala 35
Leu Ala Met 50
Leu Thr Lys 65
Trp Leu lie
lie Ala Tyr
Ser Gly Asn 115
Val lie Asp Glu 25
Leu Ser Lys Arg Ala Cys Gln Gly 40
Phe lie Ala Leu
Tyr
30
Cys
Val
15
Leu
Ser Pro Gly lie 55 Asn
Lys
Gly
Cys 100 Pro
Leu lie 70
Ala Ala Ala 85
lie Gly Tyr Tyr Pro Trp
Tyr lie Lys Gly Val
Gly Ala 105 Asp Gly 120
Leu
90
Leu
Val
75
Ala
Ala 60 Gly
lie 45
Gly Ala
Thr Asn Arg
Gly Ala Ala Gly
Val Ala Leu Gly
Phe lie Ser Ala 125
Cys 110 Thr
Gly
95
Asp
Leu
Asp
Ala
Val
Gly 80 Lys
lie Val Arg
<210>40
<211>354
<212>DNA
<213>肺炎鏈球菌
<400>40
1317]atggaacttgtattaccaaataattatgttgtgattgatg aagaagaaatgatgtatctt601318]gatgggggagcttatttaagcaagcgtgcttgtcaaggaatttgcgtagctttagctatg1201319]agtccaggaatttttatagcattagctggagctgcagtttactaataaac1801320]tatattaaggttggaggtcttggaggctggcttattggtgcagcagcaggtgtattggct2401321]acagcagcaggaaaaatagcttactgtattggatatggtgctcttaatagaggttgtgat3001322]attagcgggaacccttatccttgggatggattcatatctgcgacagtaagatga354
<210>41
<211>123
<212>PRT
<213>肺炎鏈球菌
<400>41[1328]Met Glu Leu Val Leu Pro Asn Asn Tyr Val Val lie Asp Glu Glu Glu151015Met Met Tyr Leu Asp Gly Gly Ala lie Tyr lie Pro Arg Trp Ala lie202530Thr Gly Ala lie Thr Gly Ala Ala Tyr Ala Ala Leu Ala Ala Ala Gly354045Gly Gly Gly Leu Gln Leu Val Leu Ala Ser Tyr Gly Leu Arg Ser Ala505560Leu Val Ala Gly lie Val Lys Gly Leu Gly Val Leu Gly lie His lie65707580Gly Asn Ala Phe Ala Asn Thr Val lie Arg Ser lie Ala Ser Ala Gly859095lie Gly Ala Gly Ala Asp Trp lie Phe Thr Asn lie lie Asp Gly Trp100105110Asp Gly Arg Arg Asp Asn Gln Leu Arg lie Gly115120<210>42<211>372<212>DNA<213>肺炎鏈球菌<400>42atggaacttg tattaccaaa taattatgtt gtgattgatg aagaagagat gatgtacctt 60gatggggggg ctatatatat acccaggtgg gcaattacag gagccattac tggtgcagca 120tatgcagcat tagcagcagc aggaggtgga ggccttcaac tagttcttgc atcttatgga 180ttacgctccg cactggtagc tgggattgtt aaaggtttag gagtattagg aattcatatt 240ggaaatgctt ttgcaaatac tgttattaga agtattgcat ctgctggaat tggtgctgga 300gctgattgga tttttaccaa tattattgat ggctgggatg ggcgacgtga taatcaattg 360agaataggtt aa372<210>43<211>126<212>PRT<213>肺炎鏈球菌<400>43Met Glu Leu Val Leu Pro Asn Asn Tyr Val Asp Leu Glu Gln Glu Glu151015Met Met Tyr Leu Asp Gly Gly Gly Val Gly Arg Asn Trp Trp Asn Ser202530Arg Gly Ser Phe Ala Thr Val Leu Asp Val Gly Leu Ala lie Tyr Ser3540451367]Gly Gly Ala Thr IleTyr Ser AlaTyr AlalieLys Lys Ala lie Ser1368]5055601369]Ala Asn Arg Gly Alalie Thr ArgThr LeuArgSer Leu lie lie Lys1370]657075801371]His Val Gly Ser AlaAla Gly HisLeu ValAsnThr Ala Leu Asn Val1372]8590951373]Ala Leu Thr Val ThrGly Phe SerLeu GlyGlyAla lie Ala Tyr Gly1374]1001051101375]Ala Asp Trp Ala AspGly Ser LeuAsp GlyTyrlie Phe Ala1376]1151201251377]<210>441378]<211>3811379]<212>DNA1380]<213>肺炎鏈球菌1381]<400>441382]atggaactcgtattaccaaa taattatgttgatcttgagc aagaagagat gatgtatctt601383]gatgggggtggtgttggtcg taactggtgg aatagtagag gtagttttgc aacagttctg1201384]gatgtaggtttggccatcta tagtggtggtgcaacaatttattctgctta tgcgataaaa1801385]aaagctatctcagctaatag aggggctattacgagaacattacgtagttt aataattaaa2401386]catgtaggtagtgcagctgg ccatttagtcaatactgcactaaacgttgc actaactgtt3001387]actggattttcactaggtgg agcaatcgcatatggggctgattgggctga cggtagctta3601388]gatggttatatttttgctta a3811389]<210>451390]<211>231391]<212>PRT1392]<213>肺炎鏈球菌1393]<220>1394]<221>misc_feature1395]<222>(11). (11)1396]<223>X 是 Val,Ala 或 Asp1397]<220>1398]<221>misc_feature1399]<222>(12)..(12)1400]<223>X 是 Ile 或 Leu1401]<220>1402]<221>misc_feature1403]<222>(13)..(13)1404]<223>X 是 Asp 或 Glu1405]<220>[1406]<221>misc_feature<222>(14). . (14)<223>X 是 Gln 或 Glu<220><221>misc_feature<222>(23). . (23)<223>X 是 Glu 或 Gly<400>45Met Glu Leu Val Leu Pro Asn Asn Tyr Val Xaa Xaa Xaa Xaa Glu Glu151015Met Met Tyr Leu Asp Gly Xaa20<210>46<211>40<212>DNA<213>人工序列<220><223> 引物<400>46cgagatctga tatctcacaa acagataacg gcgtaaatag40<210>47<211>43<212>DNA<213>人工序列<220><223> 引物<400>47gaagatcttc cccgggatca caaacagata acggcgtaaa tag43<210>48<211>42<212>DNA<213>人工序列<220><223> 引物<400>48cgagatctga tatccatcac aaacagataa cggcgtaaat ag42<210>49<211>32<212>DNA
471445]<213>人工序列1446]<220>1447]<223>引物1448]<400>491449]cgggatcctt atggacctgaatcagcgttg1450]<210>501451]<211>231452]<212>DNA1453]<213>人工序列1454]<220>1455]<223>引物1456]<400>501457]ggatgctttg tttcaggtgtate1458]<210>511459]<211>821460]<212>DNA1461]<213>人工序列1462]<220>1463]<223>引物1464]<400>511465]catgatatcg gtacctcaagctcatatcat1466]ttagcggata acaatttcacac1467]<210>521468]<211>811469]<212>DNA1470]<213>人工序列1471]<220>1472]<223>引物1473]<400>521474]gcggatcccc cgggcttaattaatgtttaa1475]gtgtgaaatt gttatccgcta1476]<210>531477]<211>241478]<212>DNA1479]<213>人工序列1480]<220>1481]<223>引物1482]<400>531483]cgccagggtt ttcccagtcacgac
48
tc32
23
tgtccggcaa tggtgtgggc tttttttgtt 60 82
acactagtcg aagatctcgc gaattctcct 60
81[1484]<210>54<211>20<212>DNA<213>人工序列<220><223> 引物<400>54tcaggggggc ggagcctatg20<210>55<211>22<212>DNA<213>人工序列<220><223> 引物<400>55tcgtatgttg tgtggaattg tg22<210>56<211>26<212>DNA<213>人工序列<220><223> 引物<400>56tccggctcgt atgttgtgtg gaattg26<210>57<211>35<212>DNA<213>人工序列<220><223> 引物<400>57ggcggatcca taaacgaaga aataagcaag gaagc35<210>58<211>30<212>DNA<213>人工序列<220><223> 引物<400>58[1523]ggcaagcttt tagatttctc tggtcatatc30<210>59<211>30<212>DNA<213>人工序列<220><223> 引物<400>59ggcggatcca aacaatttca actaaggagg30<210>60<211>31<212>DNA<213>人工序列<220><223> 引物<400>60ggcaagcttt catcttactg tcgcagatat g3權利要求
1.肺炎鏈球菌蛋白質或多肽,其序列選自表1所示序列。
2.如權利要求1所要求的蛋白質或多肽,其以基本上純的形式提供。
3.與權利要求1或2定義的一種蛋白質或多肽基本相同的蛋白質或多肽。
4.權利要求1到3任一項所定義的蛋白質或多肽的同源物或衍生物。
5.為表1和3所定義的蛋白質或多肽的抗原性和/或免疫原性片段。
6.肺炎鏈球菌蛋白質,或其片段或同源物或衍生物,該蛋白質具有N末端序列 MELVLPNNYVV (D,A) I (L) D (E) E (Q) EEMMYLDGG (E),其中括號內的殘基代表其前面氨基酸的替換。
7.核酸分子,其包含或由如下序列構成(i)表1到3所列的任何DNA序列或其RNA等同物; ( )與(i)中任何序列互補的序列;(iii)與(i)或(ii)中序列編碼相同蛋白質或多肽的序列;(iv)與(i)、(ii)和(iii)中的任何序列基本相同的序列; (ν)編碼表1定義的蛋白質的同源物、衍生物或片段的序列。
8.具有選自表1到3所示序列的蛋白質或多肽、或其同源物、衍生物和/或片段作為免疫原和/或抗原的用途。
9.免疫原性和/或抗原性組合物,其包含一或多種選自其序列為表1到3所示的蛋白質或多肽、或其同源物、或衍生物、和/或任何這些分子的片段。
10.如權利要求8要求的用途,其中抗原和/或免疫原用于疫苗或診斷化驗。
11.如權利要求10要求的疫苗,其包含一或多種選自賦形劑、稀釋劑、佐劑或類似物質的添加成份。
12.疫苗組合物,其包含一或多種表1到3定義的核酸序列。
13.檢測/診斷肺炎鏈球菌的方法,其包括將要檢測的樣品與至少一種如表1到3所定義的蛋白質或多肽、或其同源物、或衍生物、或片段接觸的步驟。
14.能與如表1到3所定義的蛋白質或多肽、或其同源物、或衍生物、或片段結合的抗體。
15.如權利要求14要求的抗體,其為單克隆抗體。
16.檢測/診斷肺炎鏈球菌的方法,其包括將要檢測的樣品與至少一種如權利要求14 或15所定義的抗體接觸的步驟。
17.檢測/診斷肺炎鏈球菌的方法,其包括將要檢測的樣品與至少一種如權利要求7所定義的核酸序列接觸的步驟。
18.確定如表1到3所定義的蛋白質或多肽是否代表可能的抗菌靶標的方法,其包括失活所述的蛋白質或多肽并確定肺炎鏈球菌是否仍然存活。
19.能拮抗、抑制、或以其它方式干擾如表1到3定義的蛋白質或多肽的功能或表達的物質在制備治療或預防肺炎鏈球菌感染的藥物中的用途。
全文摘要
本發(fā)明涉及分泌型肺炎鏈球菌蛋白質,具體地描述了肺炎鏈球菌新的蛋白質,及其編碼核酸序列。還描述了它們在疫苗和篩選方法中的應用。為肺炎球菌疾病的預防、控制、診斷或治療提供了有力的工具。
文檔編號A61P31/04GK102286083SQ200910265659
公開日2011年12月21日 申請日期2002年3月28日 優(yōu)先權日2001年3月30日
發(fā)明者D·巴德考克, J·M·韋爾斯, K·皮克, P·J·H·斯?jié)? R·W·F·勒佩吉, S·B·漢尼菲 申請人:賽諾菲巴斯德有限公司