亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

集合及其使用方法

文檔序號(hào):3570473閱讀:1488來(lái)源:國(guó)知局
專利名稱:集合及其使用方法
集合及其使用方法相關(guān)申請(qǐng)的交叉引用本申請(qǐng)要求2010年1月四日提交的美國(guó)臨時(shí)申請(qǐng)系列第61Λ99,401號(hào)和2009 年5月四日提交的美國(guó)臨時(shí)申請(qǐng)系列第61/182,350號(hào)的權(quán)益,二者均通過(guò)引用整體并入本文。背景在尤其是治療性抗體領(lǐng)域中的藥物研發(fā)上的進(jìn)展正快速地使許多疾病的治療成為可能和/或改進(jìn)許多疾病的治療。這些達(dá)到新穎的目標(biāo)空間并提供新穎的作用機(jī)制的進(jìn)展正日益改善患者的生活質(zhì)量,甚至是患有最嚴(yán)重的和挑戰(zhàn)性的疾病的患者。一般對(duì)于保健制度特別是患者來(lái)說(shuō)的一個(gè)挑戰(zhàn)是由這些藥物進(jìn)展賦予的新藥的成本也在快速地增加。 高成本是由于藥物特別是抗體的研發(fā)所需的投資目前每種市售產(chǎn)品超過(guò)十億美元。研發(fā)的高失敗風(fēng)險(xiǎn)和極長(zhǎng)的研發(fā)時(shí)間線使得這些投資不可避免。從潛在治療性抗體的鑒定時(shí)起直到它上市并可以使患者受益可能要超過(guò)十五年。從鑒定、臨床前、臨床到進(jìn)入市場(chǎng)的每個(gè)研發(fā)階段充滿了挑戰(zhàn)和風(fēng)險(xiǎn)。制藥公司不斷地審估以確定如何通過(guò)減少時(shí)間線和失敗風(fēng)險(xiǎn)來(lái)減少研發(fā)成本,以使最有效的藥品快速達(dá)到患者手中,并使他們負(fù)擔(dān)得起。以下公開(kāi)內(nèi)容提供了允許更快地鑒定用于治療可以說(shuō)任何疾病的最優(yōu)治療性抗體的一種有價(jià)值的進(jìn)展。候選的治療性抗體必須滿足許多研發(fā)標(biāo)準(zhǔn)以使其上市,所述研發(fā)標(biāo)準(zhǔn)諸如長(zhǎng)期穩(wěn)定性和高表達(dá)產(chǎn)率。本公開(kāi)的進(jìn)展提高了鑒定直接從開(kāi)始就滿足所有的嚴(yán)格研發(fā)標(biāo)準(zhǔn)的抗體的概率和速度。由此得到的抗體將更廉價(jià)地生產(chǎn)并且在眾多疾病的治療上將是有效的且安全的。鑒定治療性抗體的公知方法是通過(guò)使用噬菌體展示技術(shù)。噬菌體展示利用生長(zhǎng)在細(xì)菌中的病毒樣粒子來(lái)展示抗體。這種技術(shù)的一個(gè)益處是使用的文庫(kù)是巨大的,具有高達(dá)IX 101°種抗體,可以快速地測(cè)試這些抗體與任何疾病相關(guān)的任何靶的結(jié)合。見(jiàn), 例如,Knappik 等人,(2000), 〃 Fully synthetic human combinatorial antibody libraries(HuCAL)based on modular consensus frameworks and CDRs randomized with trinucleotides (基于模塊共有構(gòu)架和以三個(gè)核苷酸隨機(jī)化的⑶R的全合成的人組合抗體文庫(kù)(HuCAL)),“ J. Mol. Biol. 11 ;296(1) 57-860以這些大數(shù)目為研究對(duì)象的益處是對(duì)靶進(jìn)行篩選的結(jié)果可產(chǎn)生數(shù)百種結(jié)合該治療靶的抗體,所有這些抗體可能是治療上相關(guān)的。但一個(gè)問(wèn)題是,通常這些抗體中只有一些是可研發(fā)的,意味著它們能夠滿足所需的所有嚴(yán)格標(biāo)準(zhǔn)以使其上市。為了使新的噬菌體展示文庫(kù)快速縮短鑒定時(shí)間線并減少內(nèi)在風(fēng)險(xiǎn),該文庫(kù)應(yīng)包括具有如下特性的抗體所述特性對(duì)于選擇和臨床研發(fā)是必要的并且將在患者中產(chǎn)生安全且有效的治療。這些特性包括1)高噬菌體展示率,使得能夠針對(duì)感興趣的靶對(duì)該集合 (collection)的每一種和每一個(gè)抗體進(jìn)行測(cè)試;幻高表達(dá)水平,使得抗體或片段可被高效地復(fù)制;幻高熱穩(wěn)定性,使得抗體能夠以有效形式到達(dá)患者;4)在血清中的高穩(wěn)定性,使得抗體能夠在體內(nèi)存活達(dá)治療相關(guān)的時(shí)間力)低免疫原性風(fēng)險(xiǎn),從而提高安全性,以及5)高度多樣性,使得可使用一個(gè)文庫(kù)來(lái)鑒定針對(duì)任何治療靶的抗體。
以基本方式模擬人免疫系統(tǒng)的文庫(kù)將是具有高度價(jià)值的,或甚至是最佳的解決辦法。人免疫系統(tǒng)包括被種系基因編碼的抗體??贵w在部分上包括可變重鏈和可變輕鏈。存在大約50種可變重鏈種系基因和大約50種可變輕鏈種系基因,合起來(lái)提供約2,500種不同的可變重鏈和可變輕鏈對(duì)的組合。在人中,認(rèn)為所有這2500種組合被產(chǎn)生。但已發(fā)現(xiàn), 某些可變重鏈、可變輕鏈和/或可變重鏈和可變輕鏈組合(對(duì))以比其他可變重鏈、可變輕鏈和/或可變重鏈和可變輕鏈組合(對(duì))更高的水平表達(dá)。假設(shè)一定存在某些比另一些表達(dá)得更多的原因,且如果這樣的話,假設(shè)高表達(dá)的種系基因可能具有有利的功能特性。 因此,提供具有有利的功能特性的抗體文庫(kù)的一種方式是產(chǎn)生包括來(lái)自免疫組庫(kù)(immune repertoire)的豐富的可變重鏈、可變輕鏈和/或可變重鏈和可變輕鏈種系對(duì)的文庫(kù)。此外,認(rèn)為人存在的種系基因序列出于明顯的原因具有非常低的免疫原性,因此可以在重組抗體中模擬這些序列以降低免疫原性風(fēng)險(xiǎn)。已從事了評(píng)估人免疫組庫(kù)中普遍的可變重鏈和輕鏈種系基因配對(duì)的方法。見(jiàn)de Wildt 等人,Analysis of heavy and light chain pairings indicates that receptor editing shapes the human antibody repertoire (重鏈禾口輕鏈配對(duì)的分析指示受體編輯 (receptor editing)塑造人抗體譜),J Mol Biol. 22 ;285 (3) :895-901 (1999 年 1 月),通過(guò)引用將其整體并入。Wildt等人從人供體采取血樣,分選已經(jīng)歷體細(xì)胞超突變(somatic hypermutation)的IgG+B細(xì)胞,PCR擴(kuò)增cDNA,對(duì)每個(gè)cDNA進(jìn)行測(cè)序,并將每條序列與已知的人可變結(jié)構(gòu)域種系基因進(jìn)行比對(duì)。Wildt等人觀察到,僅有一些種系基因占據(jù)免疫組庫(kù)的優(yōu)勢(shì)地位,并且頻繁表達(dá)的重鏈和輕鏈基因區(qū)段通常是成對(duì)的。還已嘗試保持個(gè)體B細(xì)胞的重鏈和輕鏈可變結(jié)構(gòu)域配對(duì)。例如,已公開(kāi)可變結(jié) 1 "! ] !^ (cognate pair),,白勺t_。 JAL Meijer ^A, Isolation of human antibody repertoires with preservation of the natural heavy and light chain pairing (1 存天然重鏈和輕鏈配對(duì)的人抗體譜的分離),J Mol Biol. ,358(3) =764-72(2006年5月5 日);和W02005042774。根據(jù)Mei jer等人所述的技術(shù)的文庫(kù)已從免疫過(guò)的宿主的個(gè)體B細(xì)胞產(chǎn)生。一般而言,通過(guò)FACS分選B細(xì)胞,以選擇代表體細(xì)胞超突變細(xì)胞的⑶38hi B細(xì)胞, PCR擴(kuò)增它們的cDNA,并且將該抗體基因產(chǎn)物插入Fab載體中以用于選擇。這種同源對(duì)文庫(kù)不是沒(méi)有限制。例如,提供B細(xì)胞的宿主通常被免疫;并且分選的B細(xì)胞群已經(jīng)被超突變, 因此,得到的文庫(kù)偏向于特定的免疫原。另外,已嘗試?yán)猛怀龅目勺冎劓溁蚩勺冚p鏈產(chǎn)生文庫(kù)。例如,在Shi等人, "De Novo Selection of High-Affinity Antibodies from Synthetic Fab Libraries Displayed on Phage as pIX Fusion Proteins (在噬菌體上展示為pIX融合蛋白的來(lái)自合成的Fab文庫(kù)的高親和力抗體的重新選擇)J Mol Biol. ,397(2) :385-96 (2010年3 月26日)(不被認(rèn)為是關(guān)于本發(fā)明的現(xiàn)有技術(shù))以及對(duì)應(yīng)的專利申請(qǐng)W0200908M62 ;和 W02006014498中,根據(jù)可變重鏈或可變輕鏈種系蛋白序列在人免疫組庫(kù)中的使用頻率將它們摻入文庫(kù)中。還進(jìn)行了另外的嘗試,該嘗試將特異性種系對(duì)摻入文庫(kù)中。例如,W01999020749描述了一種文庫(kù),其中文庫(kù)成員包括具有由人種系重鏈基因區(qū)段DP-47(IGHV3-2;3)編碼的高變環(huán)和/或由該種系基因編碼的構(gòu)架區(qū)的規(guī)范結(jié)構(gòu)的重鏈,和/或具有由人種系輕鏈基因區(qū)段02/012 (IGKV1-39/1D-39)編碼的高變環(huán)和/或由該種系基因編碼的構(gòu)架區(qū)的規(guī)范結(jié)構(gòu)的輕鏈。另外的方法已產(chǎn)生直接來(lái)自B細(xì)胞或衍生自B細(xì)胞的文庫(kù)。例如,Glanville等人,Precise Determination of the Diversity of a Combinatorial Antibody Library Gives Insight into the Human Immunoglobulin Repertoire (組合抗體文庫(kù)的多樣性的準(zhǔn)確測(cè)定給予了對(duì)人免疫球蛋白譜的深入了解),Natl Acad Sci 1 ; 106 (48) 20216-21 (2009年12月)(不被認(rèn)為是關(guān)于本發(fā)明的現(xiàn)有技術(shù)),描述了由肪4種人供體免疫球蛋白M(IgM)譜的多樣性構(gòu)建的抗體文庫(kù)。具體而言,對(duì)來(lái)自6M個(gè)人類供體的重鏈和輕鏈V基因cDNA分別進(jìn)行PCR擴(kuò)增(分離可變重鏈和輕鏈對(duì)),然后將這些重鏈和輕鏈結(jié)構(gòu)域隨機(jī)地重新關(guān)聯(lián)。W0200305M16描述了從顯示對(duì)感興趣的病原體明顯響應(yīng)的宿主分離B細(xì)胞,這些病原體產(chǎn)生于被微生物感染或用疫苗治療。在W0200305M16中,對(duì)編碼可變區(qū)的CDR3區(qū)的cDNA進(jìn)行測(cè)序,并且設(shè)計(jì)包含優(yōu)勢(shì)CDR3的抗體片段。W02009100896描述了從免疫的宿主分離B細(xì)胞,其中對(duì)編碼可變重鏈區(qū)和可變輕鏈區(qū)的cDNA進(jìn)行測(cè)序,并且確定未配對(duì)的可變重鏈和可變輕鏈序列的豐度。在W02009100896(不被認(rèn)為是關(guān)于本發(fā)明的現(xiàn)有技術(shù))中,合成包括隨機(jī)重組的可變重鏈和可變輕鏈的文庫(kù),其中抗體是對(duì)一種免疫原特異的。這些方法和其他方法的概述見(jiàn)于Fuh等人,Synthetic antibodies as therapeutics (作為療法的合成抗體),Expert Opin Biol Ther. ,7(1) :73-87 (2007 年 1 月)。因此,對(duì)于摻入在人免疫組庫(kù)中表達(dá)的具有有利的生物物理特性的可變重鏈和可變輕鏈種系基因?qū)Φ目贵w或其片段的集合存在高度需求,所述有利的生物物理特性產(chǎn)生在患者中安全且有效的容易開(kāi)發(fā)的抗體。本發(fā)明滿足了這些需求和其他需求。概述本公開(kāi)內(nèi)容對(duì)有效地鑒定針對(duì)任何靶的可開(kāi)發(fā)的且在患者中安全和有效的抗體的問(wèn)題提供了有價(jià)值的解決辦法。從最一般的意義上講,發(fā)明人開(kāi)始于如下想法以基本方式模擬人免疫系統(tǒng)的抗體文庫(kù)可能是有利的。一方面,發(fā)明人決定通過(guò)將來(lái)自人免疫組庫(kù)的最佳種系基因序列摻入抗體中來(lái)模擬人免疫系統(tǒng)。這樣,在一些實(shí)施方案中,文庫(kù)的抗體包括序列上為種系的部分,例如構(gòu)架區(qū)。使用種系序列將顯著地降低在患者中治療性使用的重組抗體的免疫原性風(fēng)險(xiǎn)。此外,發(fā)明人根據(jù)其如下假設(shè)而研究在人免疫組庫(kù)中富含的可變重鏈和可變輕鏈種系基因?qū)赡芫哂杏欣纳镂锢硖匦?,將?dǎo)致更有效率的臨床研發(fā),提高得到的抗體在患者中的安全性和效力。作為背景,每個(gè)B細(xì)胞編碼一種抗體,并且每種抗體包含可變重鏈和可變輕鏈??蓪⒖贵w的可變重鏈和可變輕鏈中的每一個(gè)與種系序列比對(duì)以確定抗體的起源,意味著可變重鏈和可變輕鏈由哪些種系基因編碼。因此,對(duì)于每種抗體來(lái)說(shuō),可變重鏈和可變輕鏈構(gòu)成種系對(duì),例如,VH3-23與VK1-5配對(duì)。為了證實(shí)突出的種系基因?qū)赡芫哂杏欣纳镂锢硖匦缘募僭O(shè),第一步是鑒定存在于人免疫組庫(kù)中的可變重鏈和可變輕鏈種系基因?qū)?。這是通過(guò)廣泛地查找公開(kāi)可用的文獻(xiàn)并通過(guò)從人宿主中對(duì)B細(xì)胞采樣而完成。下一步,匯集、分析原始數(shù)據(jù),并根據(jù)發(fā)生率對(duì)存在于人免疫組庫(kù)中的可變重鏈和可變輕鏈種系對(duì)進(jìn)行分級(jí)。從這個(gè)數(shù)據(jù)很清楚的是, 某些可變重鏈和可變輕鏈種系基因?qū)Ρ绕渌N系對(duì)更頻繁地存在于人免疫組庫(kù)中。另外,發(fā)明人認(rèn)為某些可變重鏈和可變輕鏈種系基因?qū)υ谟字葿細(xì)胞(未經(jīng)歷抗原的)與經(jīng)歷抗原的B細(xì)胞中可差異地表達(dá),因此,基于采樣的B細(xì)胞的發(fā)育或分化來(lái)分析匯集數(shù)據(jù)。從我們的分析很清楚的是,某些種系基因?qū)υ谟字葿細(xì)胞群與經(jīng)歷抗原的B細(xì)胞群中差異地表達(dá)。下一步,必須確定要測(cè)試哪些種系蛋白對(duì),因?yàn)樵谌嗣庖呓M庫(kù)中存在約2500對(duì)。 一種方式是測(cè)試最突出地出現(xiàn)在人免疫組庫(kù)中的可變重鏈和可變輕鏈種系蛋白對(duì),例如, 見(jiàn)表18。人們可例如選擇前四百對(duì)用于測(cè)試,或者選擇表達(dá)高于某個(gè)閾值濃度的可變重鏈和可變輕鏈種系基因?qū)?。這種方法將需要合成和測(cè)試大量可變重鏈和可變輕鏈種系蛋白對(duì)序列;因此,這種方法可能不是非常有效率的。作為一種可選的方法,發(fā)明人選擇了代表、準(zhǔn)確地再現(xiàn)或覆蓋大多數(shù)來(lái)自人免疫組庫(kù)的突出表達(dá)的對(duì)的一小組可變重鏈和可變輕鏈種系對(duì)。這種方法部分上基于如下觀察結(jié)果少量可變重鏈、可變?chǔ)瘦p鏈和可變?chǔ)溯p鏈種系基因在人免疫組庫(kù)中占優(yōu)勢(shì)。Wildt 等人在895-896頁(yè)描述了這種現(xiàn)象。Wildt等人還說(shuō)明頻繁表達(dá)的重鏈和輕鏈基因區(qū)段通常是成對(duì)的,并且觀察到采樣的一半配對(duì)僅對(duì)應(yīng)于五個(gè)種系對(duì)。因此,可以聯(lián)合少量的突出表達(dá)的重鏈和輕鏈種系基因(未成對(duì)的)以產(chǎn)生一組代表人免疫組庫(kù)的對(duì)。這種方法以下列方式進(jìn)行。分析匯集數(shù)據(jù)和另外的數(shù)據(jù)(僅鑒定VH或VL的表達(dá)而不是關(guān)聯(lián)對(duì)的表達(dá))來(lái)確定在人免疫組庫(kù)中可變重鏈、可變?chǔ)瘦p鏈和可變?chǔ)溯p鏈的種系基因表達(dá)。下一步,評(píng)估突出表達(dá)的可變重鏈、可變?chǔ)瘦p鏈和可變?chǔ)溯p鏈種系蛋白序列 (不是對(duì))以確定其與研發(fā)相關(guān)的生物物理特性。經(jīng)由計(jì)算機(jī)模擬(in silico)評(píng)估了可變重鏈、可變?chǔ)瘦p鏈和可變?chǔ)溯p鏈種系蛋白序列的以下特性(i)CDR長(zhǎng)度,(ii)等電點(diǎn) (Pl)(優(yōu)選的等電點(diǎn)是8或以上,因?yàn)檫@將提供在中性配制緩沖液中的穩(wěn)定性),(iii)翻譯后修飾(PTM)(具體地說(shuō),N連接的糖基化位點(diǎn)(NxS或NxT)或化學(xué)修飾如Asp切割(通常在DP)),(iv) Asp異構(gòu)化(DD,DG),(ν)脫酰胺作用(NS,NG)(這可在體內(nèi)(在血清中)或在儲(chǔ)存時(shí)在配制緩沖液中發(fā)生并且導(dǎo)致抗體結(jié)合的喪失),(vi)在CDR中甲硫氨酸的存在 (當(dāng)暴露于溶劑時(shí)可被氧化),(vii)未成對(duì)的半胱氨酸的存在(將與任何其他未成對(duì)的半胱氨酸形成二硫鍵,由此導(dǎo)致蛋白的交聯(lián)和/或較低的表達(dá)水平),(viii)偏離種系,(ix) 潛在的T細(xì)胞表位的存在,以及(χ)理論上的聚集傾向。下一步,組合具有有利的生物物理特征的可變重鏈、可變?chǔ)瘦p鏈和可變?chǔ)溯p鏈種系對(duì)以形成可變重鏈和可變輕鏈對(duì)。如表23所示,這一小組的對(duì)代表、準(zhǔn)確地再現(xiàn)或覆蓋大多數(shù)來(lái)自人免疫組庫(kù)的突出表達(dá)的對(duì)。這是通過(guò)如下方式完成的合成可變重鏈和可變輕鏈種系基因、將它們組合成對(duì)、將這些對(duì)表達(dá)成蛋白并測(cè)試每種蛋白來(lái)鑒定這些對(duì)的生物物理特性。測(cè)試了以下特性(i)在噬菌體上以Fab形式的相對(duì)展示率,(ii)以Fab形式的相對(duì)表達(dá)水平,例如,在大腸桿菌中;(iii)以Fab形式的熱穩(wěn)定性;(iv)以Fab形式在牛血清或小鼠血清中的穩(wěn)定性;(ν)以IgG形式的相對(duì)表達(dá)水平;(vi)以IgG形式在牛血清中的穩(wěn)定性。鑒定具有有利的生物物理特性的種系蛋白對(duì)后,將集合設(shè)計(jì)成包括這些對(duì)。本公開(kāi)內(nèi)容的一個(gè)方面是如下抗體或功能片段的集合所述抗體或功能片段包括具有增強(qiáng)可研發(fā)性(developability)的有利特性的可變重鏈和輕鏈種系基因?qū)Γ话ú痪哂羞@些特性的可變重鏈和輕鏈種系基因?qū)?,即使不具有這些特性的可變重鏈和輕鏈種系基因?qū)Ρ煌怀龅乇磉_(dá)在人免疫組庫(kù)中。以這種方式,將集合設(shè)計(jì)成不包括自然存在的(在2,500對(duì)中)不具有有利的功能特性的可變重鏈和輕鏈的組合或?qū)?。例如,VH4-34是人免疫組庫(kù)中頻繁出現(xiàn)的,如表20所示,但是還已知源自這種重鏈種系基因的抗體對(duì)B細(xì)胞有細(xì)胞毒性,因此源自這種基因的抗體可從文庫(kù)設(shè)計(jì)中排除。見(jiàn)Miat等人,Rapid cytotoxicity of human B lymphocytes induced by VH4-34(VH4. 21)gene-encoded monoclonal antibodies (由VH4-34(VH4. 21)基因編碼的單克隆抗體誘導(dǎo)的人B淋巴細(xì)胞的快速細(xì)胞毒性),Clin Exp Immunol.,105(1) :183-90(1996 年 7 月)。在一些實(shí)施方案中,本發(fā)明的集合包括含大量功能上有利的可變重鏈和可變輕鏈的組合或?qū)Φ目贵w,以致這些集合的抗體十分多樣,從而提供可用于鑒定針對(duì)任何治療靶的抗體的集合。這些集合克服了現(xiàn)有技術(shù)的許多問(wèn)題。例如,源自B細(xì)胞的同源文庫(kù)沒(méi)有加入這個(gè)概念,因?yàn)樵谶@種文庫(kù)中存在的VH和VL類配對(duì)與在B細(xì)胞樣品中存在的類配對(duì)相同。如果取得足夠大的B細(xì)胞樣品,近似50個(gè)VH和50個(gè)VL的類配對(duì)組合Q500)中的每一個(gè)都將存在。在本公開(kāi)內(nèi)容中VH和VL對(duì)的廣泛測(cè)試顯示許多VH和VL種系基因?qū)](méi)能具有容許在臨床上的可研發(fā)性的特性。因此,這種同源文庫(kù)包括可能不可開(kāi)發(fā)的許多VH和VL對(duì)。 因此,產(chǎn)生只包括具有有利的功能特性的VH和VL類對(duì)的大多樣性的文庫(kù)可能是令人期望的,但是對(duì)于同源文庫(kù)方法,這是不能的。此外,在一些實(shí)施方案中,包含在集合中的種系基因?qū)κ腔谟字葿細(xì)胞或未經(jīng)歷抗原的B細(xì)胞的樣品,因此,所代表的種系基因?qū)Σ黄蛴谔囟ǖ拿庖咴⑶疫@些集合可能在針對(duì)任何免疫原進(jìn)行篩選上是優(yōu)秀的。附圖描述

圖1顯示在周質(zhì)提取具有VH3-23重鏈(上圖)和VH1-69重鏈(下圖)的抗體后的抗-Fd表達(dá)ELISA的結(jié)果,每種抗體帶有三種修飾的phoA信號(hào)序列之一,所述修飾的phoA 信號(hào)序列相比于野生型(TKA)信號(hào)序列包括C端限制酶切位點(diǎn)AfIII (VLS)、NheI (VLA)和 AvrII (VLG)。在VH3-23組中,所有修飾的phoA信號(hào)序列保持了野生型(TKA)范圍內(nèi)的表達(dá)水平。圖2顯示了在周質(zhì)提取具有VK1-39輕鏈(左上圖)、VK3-11輕鏈(右上圖)、 VL1-40輕鏈(左下圖)和VL3-1輕鏈(右下圖)的抗體后的抗-Fd表達(dá)ELISA的結(jié)果,每種抗體帶有三種修飾的ompA信號(hào)序列之一,所述修飾的ompA信號(hào)序列相比于野生型(AQA) 信號(hào)序列包括C端限制酶切位點(diǎn)NdeI (AYG) ,NdeI (AYA)和BsiWI (TYA)。使用V κ和V λ Fab 片段二者測(cè)試了包括C端限制酶切位點(diǎn)的修飾的ompA信號(hào)序列和野生型信號(hào)序列。包括 NdeI (AYA)的信號(hào)序列始終顯示與野生型(AQA) —樣好或更好的表達(dá)。圖3顯示了如實(shí)施例1-1. 3中詳述的被選擇用于摻入phoA和ompA大腸桿菌信號(hào)序列的C端中的限制酶切位點(diǎn),并且包括CDR 3周?chē)男盘?hào)序列及其各自的取向。這幅圖在展示大腸桿菌信號(hào)序列的同時(shí)還表示如實(shí)施例1. 5中詳述的選擇用于在IgG表達(dá)中使用的人重鏈和κ鏈前導(dǎo)序列中摻入的C端限制酶切位點(diǎn)。圖4-9顯示在1Tsuiji M.等人Q006)中分離并描述的B細(xì)胞的VH/VL種系基因?qū)ΑD10-12顯示在Tiller Τ.等人Q007)中分離并描述的B細(xì)胞的VH/VL種系基因?qū)Α?br> 圖13-17顯示在Mietzner B.等人Q008)中分離并描述的B細(xì)胞的VH/VL種系基因?qū)?。圖18-20顯示在Wardemann H.等人Q003)中分離并描述的B細(xì)胞的VH/VL種系基因?qū)?。圖21-23顯示在Yurasov S.等人Q005)中分離并描述的B細(xì)胞的VH/VL種系基因?qū)?。圖M16顯示在Yurasov S.等人Q006)中分離并描述的B細(xì)胞的VH/VL種系基因?qū)?。圖27顯示用于擴(kuò)增分離自人宿主的單個(gè)分選的成熟的幼稚B細(xì)胞(mn)和抗體分泌細(xì)胞(asc)的cDNA的PCR策略,如實(shí)施例2. 2中詳述的。圖觀-36顯示如實(shí)施例2. 2中詳述的分離自人樣品的B細(xì)胞的VH/VL對(duì)。圖37顯示選擇用于合成、組合和功能表征的20種VH種系基因,如實(shí)施例4_4. 1 詳述的。該圖還顯示每種種系基因經(jīng)由計(jì)算機(jī)模擬分析的結(jié)果,其中Pl代表等電點(diǎn),PTM是如本文所述的互補(bǔ)決定區(qū)中的翻譯后修飾,NxS/T是N連接的糖基化位點(diǎn),并且在CDR中的 Met是甲硫氨酸。圖38顯示選擇用于合成、組合和功能表征的8種V λ和12種V κ種系基因,如實(shí)施例4-4. 1詳述的。該圖還顯示每種種系基因的經(jīng)由計(jì)算機(jī)模擬分析的結(jié)果,其中pi代表等電點(diǎn),PTM是如本文所述的互補(bǔ)決定區(qū)中的翻譯后修飾,NxS/T是N連接的糖基化位點(diǎn),并且在⑶R中的Met是甲硫氨酸。圖39顯示了來(lái)自示于圖446的實(shí)施例2. 1和示于圖觀_36的實(shí)施例2. 2的匯集數(shù)據(jù)的VH/Vk對(duì)。數(shù)字條目代表匯集數(shù)據(jù)中鑒定的來(lái)自個(gè)體B細(xì)胞的每個(gè)VH/V κ種系基因?qū)Φ臄?shù)目。Y軸顯示根據(jù)匯集數(shù)據(jù)中的表達(dá)頻率從頂部(VH3-23)到底部(VH3-20)排序的VH種系基因。X軸顯示根據(jù)匯集數(shù)據(jù)中的表達(dá)頻率從左(IGKV3-20)到右(IGKV1D-17) 排序的V κ種系基因。數(shù)字1358是采樣的B細(xì)胞數(shù)目。圖40顯示了來(lái)自示于圖446的實(shí)施例2. 1和示于圖觀_36的實(shí)施例2. 2的匯集數(shù)據(jù)的VH/νλ對(duì)。數(shù)字條目代表匯集數(shù)據(jù)中鑒定的來(lái)自個(gè)體B細(xì)胞的每個(gè)VH/V λ種系基因?qū)Φ臄?shù)目。Y軸顯示根據(jù)匯集數(shù)據(jù)中的表達(dá)頻率從頂部(VH3-23)到底部(VH3-20)排序的VH種系基因。X軸顯示根據(jù)匯集數(shù)據(jù)中的表達(dá)頻率從左(IGLV2-14)到右(IGLV4-60)排序的V λ種系基因。數(shù)字779是采樣的B細(xì)胞數(shù)目。圖41顯示了來(lái)自示于圖446的實(shí)施例2. 1和示于圖觀_36的實(shí)施例2. 2的匯集數(shù)據(jù)的VH/Vk對(duì),但僅包括未成熟的B細(xì)胞、新的遷移B細(xì)胞和成熟的幼稚B細(xì)胞的未經(jīng)歷抗原的B細(xì)胞群以鑒定在幼稚的人免疫組庫(kù)中突出的VH/Vk對(duì)。數(shù)字條目代表匯集數(shù)據(jù)中鑒定的來(lái)自個(gè)體B細(xì)胞的每個(gè)VH/VL種系基因?qū)Φ臄?shù)目。Y軸顯示根據(jù)匯集數(shù)據(jù)中的表達(dá)頻率從頂部(VH3-23)到底部(VH3-20)排序的VH種系基因。X軸顯示根據(jù)匯集數(shù)據(jù)中的表達(dá)頻率從左(IGKV3-20)到右(IGKV1D-17)排序的Vk種系基因。數(shù)字888是采樣的 B細(xì)胞數(shù)目。圖42顯示了來(lái)自示于圖446的實(shí)施例2. 1和示于圖觀_36的實(shí)施例2. 2的匯集數(shù)據(jù)的VH/νλ對(duì),但僅包括未成熟的B細(xì)胞、新的遷移B細(xì)胞和成熟的幼稚B細(xì)胞的未經(jīng)歷抗原的B細(xì)胞群以鑒定在幼稚的人免疫組庫(kù)中突出的VH/VX對(duì)。數(shù)字條目代表匯集數(shù)據(jù)中鑒定的來(lái)自個(gè)體B細(xì)胞的每個(gè)VH/VX種系基因?qū)Φ臄?shù)目。Y軸顯示根據(jù)匯集數(shù)據(jù)中的表達(dá)頻率從頂部(VH3-23)到底部(VH3-20)排序的VH種系基因。X軸顯示根據(jù)匯集數(shù)據(jù)中的表達(dá)頻率從左(IGLV2-14)到右(IGLV4-60)排序的V λ種系基因。數(shù)字457是采樣的B 細(xì)胞數(shù)目。圖43顯示了來(lái)自示于圖446的實(shí)施例2. 1和示于圖觀_36的實(shí)施例2. 2的匯集數(shù)據(jù)的VH/V κ對(duì),但僅包括IgG抗體分泌細(xì)胞以及IgM和IgG記憶性B細(xì)胞的經(jīng)歷抗原的 B細(xì)胞群。數(shù)字條目代表匯集數(shù)據(jù)中鑒定的來(lái)自個(gè)體B細(xì)胞的每個(gè)VH/Vk種系基因?qū)Φ臄?shù)目。Y軸顯示根據(jù)匯集數(shù)據(jù)中的表達(dá)頻率從頂部(VH3-23)到底部(VH3-20)排序的VH種系基因。X軸顯示根據(jù)匯集數(shù)據(jù)中的表達(dá)頻率從左(IGKV3-20)到右(IGKV1D-17)排序的Vk 種系基因。數(shù)字470是采樣的B細(xì)胞數(shù)目。圖44顯示了來(lái)自示于圖446的實(shí)施例2. 1和示于圖觀_36的實(shí)施例2. 2的匯集數(shù)據(jù)的VH/V λ對(duì),但僅包括IgG抗體分泌細(xì)胞以及IgM和IgG記憶性B細(xì)胞的經(jīng)歷抗原的 B細(xì)胞群。數(shù)字條目代表匯集數(shù)據(jù)中鑒定的來(lái)自個(gè)體B細(xì)胞的每個(gè)VH/VX種系基因?qū)Φ臄?shù)目。Y軸顯示根據(jù)匯集數(shù)據(jù)中的表達(dá)頻率從頂部(VH3-23)到底部(VH3-20)排序的VH種系基因。X軸顯示根據(jù)匯集數(shù)據(jù)中的表達(dá)頻率從左(IGLV2-14)到右(IGLV4-60)排序的νλ 種系基因。數(shù)字322是采樣的B細(xì)胞數(shù)目。圖45A-C顯示由VH種系基因編碼的氨基酸序列,如在以下文獻(xiàn)中所述=Tomlinson 等人’ (1992), "The Repertoire of Human Germline Vh Sequences Reveals about Fifty Groups of Vh Segments with Different Hypervariable Loop (人禾中系 Vh 序列的組庫(kù)揭示大約五十組具有不同超變環(huán)的Vh區(qū)段)” J. Mol. Biol. 227,776-798 ;Matsuda 等人(1998), "The complete nucleotide sequence of the human immunoglobulin heavy chain variable region locus (人免疫球蛋白重鏈可變區(qū)基因座的完整核苷酸序列),,J Exp Med 188(11) :2151-62 ;禾口 LeFranc MP(2001) "Nomenclature of the human immunoglobulin heavy (IGH) genes (人免疫球蛋白重鏈(IGH)基因的命名)· ”Exp Clin Immunogenet. 18(2) :100_16o圖46A-C顯示了由Vk種系基因編碼的氨基酸序列,如在以下文獻(xiàn)中所述 Sellable 禾口 Zachau(1993),“The variable genes of the human immunoglobulin kappa locus (人免疫球蛋白κ基因座的可變基因),”Biol.Chem Hoppe Seyler. 374(11) 1001-22 ;Brensing_Kiippers 等人(1997), "Thehuman immunoglobulin kappa locus on yeast artificial chromosomes (YACs)(在酵母人工染色體(YAC)上的人免疫球蛋白κ 基因座)”Gene. 191(2) :173-81 ;Kawasaki 等人(2001), "Evolutionary dynamics of the human immunoglobulin kappa locus and the germline repertoire of the Vkappa genes(人免疫球蛋白κ基因座和Vk基因的種系組庫(kù)的進(jìn)化動(dòng)態(tài))”Eur J Immunol 31(4) :1017-28 ;禾口 Lefranc MP(2001) " Nomenclature of the human immunoglobulin kappa(IGK) genes (人免疫球蛋白 κ (IGK)基因的命名)〃 Exp Clin Immunogenet.,18, 161-174。圖4743顯示由¥入種系基因編碼的氨基酸序列,如在以下文獻(xiàn)中所述=Kawasaki 等人,(1997) “One-Megabase Sequence Analysis of the Human immunoglobulin lambda Gene Locus(人免疫球蛋白λ基因座的一兆堿基序列分析)”Genome Research 7(3)250-61 ;Frippiat 等人,(1995) “ Organization of the human immunoglobulin lambda light-chain locus on chromosome 22qll. 2 (在染色體 22qll. 2 上的人免疫球蛋白 λ 輕鏈基因座的組織)〃 Hum. Mol. Genet.,4,983-991 ;和 LeFranc MP (2001) “ Nomenclature of the human immunoglobulin lambda(IGL) genes ( Λ^it S S λ (IGL) SSW^ 名)·Εχρ Clin Immunogenet. ;18 :242_254。圖48顯示pJPdl三順?lè)醋?tricistronic)噬菌體展示載體。圖49顯示ρJPxIFab表達(dá)載體。圖 50 顯示 pMxll (pMORPHXll)Fab 表達(dá)載體。圖51顯示pM0RPH30Fab展示載體。圖52顯示pJP_h_IgGlf可變重鏈IgG表達(dá)載體。圖53顯示pJP_h_Ig_ κ可變?chǔ)瘦p鏈IgG表達(dá)載體。圖54顯示pJP_h_Ig_ λ 2可變?chǔ)溯p鏈IgG表達(dá)載體。圖55顯示測(cè)試的400個(gè)VH/VL種系基因?qū)Φ南鄬?duì)Fab展示率。較高的數(shù)字指示較高的展示水平。圖56顯示測(cè)試的400個(gè)VH/VL種系基因?qū)Φ南鄬?duì)Fab表達(dá)水平。較高的數(shù)字指示較高的Fab表達(dá)水平。圖57顯示以Fab形式的測(cè)試的400個(gè)VH/VL種系基因?qū)Φ臏囟确€(wěn)定性數(shù)據(jù)。數(shù)字60和70指示在測(cè)試的設(shè)置中在60°C或70°C穩(wěn)定持續(xù)45min的VH/VL對(duì)。數(shù)字4指示溫度不穩(wěn)定的對(duì)并且bg指示低表達(dá)水平。圖58顯示以Fab形式的測(cè)試的400個(gè)VH/VL種系基因?qū)υ谂Q逯械姆€(wěn)定性數(shù)據(jù)。S代表在測(cè)試的條件下穩(wěn)定的并且U代表在測(cè)試的條件下不穩(wěn)定的。圖59顯示以Fab形式的測(cè)試的400個(gè)VH/VL種系基因?qū)υ谛∈笱逯械姆€(wěn)定性數(shù)據(jù)。S代表在測(cè)試的條件下穩(wěn)定的并且U代表在測(cè)試的條件下不穩(wěn)定的。圖60顯示測(cè)試的400個(gè)VH/VL種系基因?qū)Φ南鄬?duì)IgG表達(dá)率。較高的數(shù)字指示較高的IgGl表達(dá)水平。圖61顯示以IgG形式的測(cè)試的400個(gè)VH/VL種系基因?qū)Φ难宸€(wěn)定性數(shù)據(jù)。S代表在測(cè)試的條件下穩(wěn)定的并且U代表在測(cè)試的條件下不穩(wěn)定的。詳述定義為了使理解本發(fā)明容易,提供了以下定義和闡釋。一般術(shù)語(yǔ)在數(shù)值和范圍上下文中的術(shù)語(yǔ)“大約”或“近似”是指近似于或接近于使得本發(fā)明可按預(yù)期實(shí)行(諸如具有期望的序列同源性的數(shù)字或百分比)的所列的值或范圍的值或范圍,根據(jù)本文包含的教導(dǎo)這對(duì)于技術(shù)人員是清楚的。這至少部分上是由于可變的培養(yǎng)條件和生物系統(tǒng)的可變性。因此,這些術(shù)語(yǔ)涵蓋超出系統(tǒng)誤差產(chǎn)生的值的值。這些術(shù)語(yǔ)使隱含的東西明確。通常,“大約”涵蓋陳述值的士 10%。因此,術(shù)語(yǔ)“大約”可用來(lái)描述范圍。在發(fā)明概述和發(fā)明描述中本文列出的所有范圍包括關(guān)于該范圍的數(shù)字或在該范圍的數(shù)字之間的所有數(shù)字或值。本發(fā)明的范圍明白地命名并列出在該范圍中的所有整數(shù)、 小數(shù)和分?jǐn)?shù)值。
術(shù)語(yǔ)“受治療者”包括人和非人動(dòng)物。非人動(dòng)物包括所有脊椎動(dòng)物,例如,哺乳動(dòng)物和非哺乳動(dòng)物,如非人靈長(zhǎng)類、羊、狗、牛、雞、兩棲動(dòng)物和爬行動(dòng)物。除另外說(shuō)明,術(shù)語(yǔ)“患者”或“受治療者”在本文可互換使用。術(shù)語(yǔ)“治療”包括施用組合物或抗體以阻止或延遲疾病的癥狀、并發(fā)癥或生物化學(xué)標(biāo)記(biochemical indicia)的發(fā)作,減輕癥狀或停止或抑制疾病、病癥或疾患的進(jìn)一步發(fā)展。因此,治療涵蓋但不限于“治愈”。治療可以是預(yù)防性的(以阻止或延遲疾病的發(fā)作,或阻止或減緩臨床癥狀或其亞臨床癥狀的表現(xiàn))或在疾病表現(xiàn)后治療性的抑制或減輕癥狀。如本文所用的“數(shù)據(jù)庫(kù)或可讀介質(zhì)”是指用于儲(chǔ)存序列數(shù)據(jù)的任何格式以及由此的任何信息集合,如數(shù)據(jù)庫(kù)文檔、查找表、Excel電子表格等等。在某些實(shí)施方案中,數(shù)據(jù)庫(kù)以電子形式存儲(chǔ),如計(jì)算機(jī)可讀的存儲(chǔ)裝置。這包括介質(zhì),如服務(wù)器、客戶端(client)、硬盤(pán)、⑶、DVD、個(gè)人數(shù)字助理如Palm Pilot、磁帶、zip盤(pán)、計(jì)算機(jī)內(nèi)部ROM(只讀存儲(chǔ)器)或因特網(wǎng)或萬(wàn)維網(wǎng)。其他計(jì)算機(jī)可獲取的用于存儲(chǔ)文檔的介質(zhì)將對(duì)本領(lǐng)域技術(shù)人員是明顯的?!敖?jīng)由計(jì)算機(jī)模擬”是指在計(jì)算機(jī)上進(jìn)行的操作、分析和設(shè)計(jì),但還可以同樣在紙上或通過(guò)心算進(jìn)行??贵w及其特性如本文所用的術(shù)語(yǔ)“抗體”包括整個(gè)抗體??贵w可以是多克隆的、親和力純化的多克隆的、單克隆的、全人的、鼠的或嚙齒動(dòng)物的、嵌合的、駱駝的或人源化的抗體。抗體可屬于任何的抗體類,如IgG, IgGl、IgG2、IgG3、IgG4、IgA(包括人亞類IgAl和IgA2)、IgD、 IgE、IgG或IgM。天然存在的“抗體”是包括由二硫鍵相互連接的至少兩條重(H)鏈和兩條輕(L)鏈的糖蛋白。如本文所用的術(shù)語(yǔ)“其功能片段”包括任何抗原結(jié)合片段,如Fab、F(ab' )2、 Fab\ Fv, scFv、包括Fc部分的單鏈、納米抗體以及具有不同于可變構(gòu)架區(qū)的支架的其他抗體樣結(jié)構(gòu)。術(shù)語(yǔ)“其功能片段”包括但不限于抗體的任何功能部分,其中功能包括免疫原的結(jié)合或效應(yīng)子功能。如本文所用,術(shù)語(yǔ)“親和力”是指在抗原位點(diǎn)處在抗體與抗原之間的相互作用的強(qiáng)度。在每個(gè)抗原位點(diǎn)之內(nèi),抗體“臂”的可變區(qū)通過(guò)非共價(jià)力與抗原在許多位點(diǎn)相互作用; 相互作用越大,親和力越強(qiáng)。如本文所用,術(shù)語(yǔ)抗體或其功能片段如IgG抗體的“高親和力” 是指抗體具有對(duì)靶抗原10_8M或更低、10_9M或更低、ΙΟ,Μ或更低、或10_"Μ或更低的KD。然而,“高親和力”結(jié)合對(duì)于其他抗體同種型來(lái)說(shuō)可能不同。例如,對(duì)于IgM同種型的“高親和力”結(jié)合是指抗體具有10_7Μ或更低、或10_8Μ或更低的KD。如本文所用的術(shù)語(yǔ)“Kassoc”或“Ka”意指特定的抗體-抗原相互作用的締合速率, 而本文所用的術(shù)語(yǔ)“Kdis”或“Kd”意指特定的抗體-抗原相互作用的解離速率。如本文所用的術(shù)語(yǔ)“KD”意指解離常數(shù),它由Kd與Ka的比(即Kd/Ka)獲得并且被表示為摩爾濃度 (M)。抗體的KD值可使用本領(lǐng)域充分確立的方法來(lái)確定。一種用于確定抗體KD的方法是通過(guò)使用表面等離子共振或使用生物傳感器系統(tǒng)如Biacore 系統(tǒng)。術(shù)語(yǔ)“交叉阻斷(cross-block)”、“交叉阻斷的”和“交叉阻斷了”在本文可互換使用,來(lái)表示在標(biāo)準(zhǔn)的競(jìng)爭(zhēng)結(jié)合測(cè)定中抗體或其他結(jié)合劑干擾其他抗體或結(jié)合劑與相同的靶結(jié)合的能力??贵w或其他結(jié)合劑能夠干擾另一種抗體或結(jié)合分子與相同的靶結(jié)合的能力或程度,以及因此是否可以根據(jù)本發(fā)明將其說(shuō)成交叉阻斷,可使用標(biāo)準(zhǔn)競(jìng)爭(zhēng)結(jié)合測(cè)定法來(lái)確定。一種適合的測(cè)定包括Biacore技術(shù)的使用(例如,通過(guò)使用BIAcore 3000儀器 (BiaCOre,UppSala,SWeden)),該技術(shù)可利用表面等離子共振技術(shù)測(cè)量相互作用的程度。另一種測(cè)量交叉阻斷的測(cè)定法利用基于ELISA的方法。術(shù)語(yǔ)“表位”表示能夠特異性結(jié)合抗體的蛋白決定簇。表位通常由化學(xué)活性表面分類的分子如氨基酸或糖側(cè)鏈組成,并且通常具有特定的三維結(jié)構(gòu)特征以及特定的電荷特征。構(gòu)象表位和非構(gòu)象表位的差別在于在存在變性溶劑的情況下與前者的結(jié)合喪失,但與后者的結(jié)合沒(méi)有。術(shù)語(yǔ)“嵌合抗體”是其中恒定區(qū)或其部分被改變、取代或交換以使得抗原結(jié)合位點(diǎn) (可變區(qū))與具有不同或改變的類別、效應(yīng)子功能和/或種類的恒定區(qū)連接的抗體分子。術(shù)語(yǔ)“同種型”是指由重鏈恒定區(qū)基因提供的抗體類(例如,IgM, IgE, IgG如IgGl 或IgG4)。同種型還包括這些類之一的修飾形式,其中已作出修飾來(lái)改變Fc功能,例如,增強(qiáng)或減少效應(yīng)子功能或與Fc受體的結(jié)合。術(shù)語(yǔ)“種系”表示從親本到后代傳下來(lái)的編碼抗體或其功能片段的核酸序列。術(shù)語(yǔ)“種系蛋白序列”表示a)由種系基因編碼的抗體或其功能片段的可變區(qū)的氨基酸序列,b)由編碼抗體或其功能片段的可變區(qū)的修飾的核酸序列所編碼的氨基酸序列,所述抗體或其功能片段的可變區(qū)具有與由種系基因編碼的抗體或其功能片段的可變區(qū)相同的氨基酸序列,其中所述核酸序列通過(guò)以下方式修飾例如,密碼子優(yōu)化、期望的限制酶切位點(diǎn)的添加、優(yōu)化的GC含量、不期望的剪接位點(diǎn)的去除或mRNA不穩(wěn)定性基序的去除, 或c)由種系基因編碼的但在氨基酸序列中具有點(diǎn)突變的氨基酸序列,所述點(diǎn)突變諸如為了去除不期望的半胱氨酸,或引入期望的限制酶切位點(diǎn)例如Bbsl,或產(chǎn)生于合成、擴(kuò)增或克隆中的錯(cuò)誤。術(shù)語(yǔ)“種系基因序列”表示a)編碼抗體或其功能片段的可變區(qū)的種系基因的核酸序列,或b)編碼具有與由種系基因所編碼的抗體的可變區(qū)相同的氨基酸序列的抗體或其功能片段的修飾的氨基酸序列,其中所述氨基酸序列通過(guò)以下方式修飾例如,密碼子優(yōu)化、期望的限制酶切位點(diǎn)的添加、優(yōu)化的GC含量、不期望的剪接位點(diǎn)的去除或mRNA不穩(wěn)定性基序的去除。術(shù)語(yǔ)“種系基因?qū)Α北硎揪幋a抗體或其功能片段的可變重鏈和可變輕鏈的核酸序列及其對(duì)應(yīng)的種系基因的對(duì)。例如,種系基因?qū)梢允荲H3-23/VK 1-5,其中由VH3-23/ VK 1-5編碼的抗體包括由種系基因VH3-23編碼的可變重鏈或其部分以及由種系基因 Vk 1-5編碼的可變輕鏈或其部分。術(shù)語(yǔ)“種系蛋白對(duì)”表示如下抗體或其功能片段,其中可變重鏈或其部分以及可變輕鏈或其部分a)各自由特定的種系基因編碼,或b)各自由編碼具有與由特定的種系基因編碼的抗體的可變區(qū)相同的氨基酸序列的抗體或其功能片段的可變區(qū)的修飾的核酸序列編碼,其中所述核酸序列通過(guò)以下方式修飾例如,密碼子優(yōu)化、期望的限制酶切位點(diǎn)的添加、優(yōu)化的GC含量、不期望的剪接位點(diǎn)的去除或mRNA不穩(wěn)定性基序的去除,或c)各自包含由種系基因編碼的但在氨基酸序列中具有點(diǎn)突變的氨基酸序列,所述點(diǎn)突變諸如為了去除不期望的半胱氨酸,或引入期望的限制酶切位點(diǎn)例如Bbsl,或產(chǎn)生于合成、擴(kuò)增或克隆中的錯(cuò)誤。例如,種系蛋白對(duì)可以是由VH3-23/VK 1-5編碼的抗體或功能片段,其中該抗體包括由種系基因VH3-23編碼的可變重鏈或其部分以及由種系基因V κ 1-5編碼的可變輕鏈或其部分。“種系蛋白對(duì)”包括如在實(shí)施例5中所制備的構(gòu)建體,所述構(gòu)建體包括a)對(duì)于VH 前導(dǎo)序列(摻入如圖3所示的NheI RE位點(diǎn)的修飾的phoA);種系FRl、 CDRU FR2、CDR2和FR3 (摻入如圖3所示的BssHIIRE位點(diǎn));如在Ewert S.等人,J. Mol. Biol. (2003)325,531-553 中所用的 4D5 抗體的 CDR-H3 (WG⑶GFYAMDY);以及 JH4FR4(摻入如圖3所示的Xhol/Sall RE位點(diǎn));b)對(duì)于Vk 前導(dǎo)序列(摻入如圖3所示的NdeI RE位點(diǎn)的ompA);種系FR1、CDR1、 FR2、CDR2和FR3(摻入如圖3所示的BbsI RE位點(diǎn));根據(jù)Ewert S.等人,J. Mol. Biol. (2003)325,531-553 的 κ 樣 CDR-L3 (QQHYTTPPT);以及 JklFR4 (摻入如圖 3 所示的 KpnI RE 位點(diǎn));和c)對(duì)于VX 前導(dǎo)序列(摻入如圖3所示的NdeI RE位點(diǎn)的ompA);種系FR1、CDR1、 FR2、CDR2和FR3(摻入如圖3所示的BbsI RE位點(diǎn));根據(jù)Ewert S.等人,J. Mol. Biol. (2003) 325,531-553 的 λ 樣 CDR-L3 (QSYDSSLSGVV);以及 J12/3FR4 (摻入如圖 3所示的KpnI RE位點(diǎn))。這些構(gòu)建體中的每一種被合成、表達(dá)并且如實(shí)施例6和7所述作為Fab和IgG測(cè)試了以下功能特性a)在噬菌體產(chǎn)生和噬菌體ELISA之后以Fab形式的相對(duì)展示;b)在大腸桿菌中的Fab產(chǎn)生、大腸桿菌細(xì)胞裂解和產(chǎn)生的Fab的ELISA檢測(cè)后的相對(duì)Fab表達(dá)水平; c)在大腸桿菌中的Fab產(chǎn)生、大腸桿菌細(xì)胞裂解和升高溫度下孵育后非變性Fab的ELISA 檢測(cè)后Fab的溫度穩(wěn)定性;d)在牛/小鼠血清中孵育后借助非變性Fab的ELISA檢測(cè)的來(lái)自大腸桿菌裂解物的Fab的牛/小鼠血清穩(wěn)定性;e)在哺乳動(dòng)物細(xì)胞中產(chǎn)生IgGl和ELISA 檢測(cè)細(xì)胞培養(yǎng)上清液中的分泌IgGl后的相對(duì)的人IgGl表達(dá)水平;和f)在牛/小鼠血清中孵育后借助非變性Fab的ELISA檢測(cè)的人IgGl的牛血清穩(wěn)定性。JigtJft^S(substantially germline protein sequence) 示由種系基因編碼的但在氨基酸序列中具有點(diǎn)突變的氨基酸序列,所述點(diǎn)突變諸如,為了去除不期望的半胱氨酸,或引入期望的限制酶切位點(diǎn)例如Bbsl,或產(chǎn)生于合成、擴(kuò)增或克隆中的錯(cuò)誤?!胺N系基因”是編碼在以下出版物中所公開(kāi)的抗體或其功能片段的種系基因的核酸,對(duì)于 VH :Tomlinson 等人,(1992),“The Repertoire of Human Germline Vh Sequences Reveals about Fifty Groups of Vh Segments with Different Hypervariable Loop (人種系Vh序列的組庫(kù)揭示大約五十組具有不同超變環(huán)的Vh區(qū)段)”J. Mol.Biol. 227,776-798 ;Matsuda 等人(1998) ,“The complete nucleotide sequence of the human immunoglobulin heavy chain variable region locus( A 免疫球蛋白重鏈可變區(qū)基因座的完整核苷酸序列)”J Exp Med 188(11) 2151-62 ; 禾口 LeFranc MP(2001) "Nomenclature of the human immunoglobulin heavy (IGH) genes (人免疫球蛋白重鏈(IGH)基因的命名).” Exp Clin Immunogenet. 18(2) :100_16 ; 對(duì)于 νλ :Kawasaki 等人’ (1997) “One-Megabase Sequence Analysis of the Human immunoglobulin lambda Gene Locus(人免疫球蛋白λ基因座的一兆堿基序列分 |/f ) “ Genome Research 7(3) 250-61 ;Frippiat ^A, (1995) “ Organization of the human immunoglobulin lambda light-chain locus on chromosome 22qll.2(在染色體22qll.2上的人免疫球蛋白λ輕鏈基因座的組織)"Hum. Mol. Genet.,4,983-991 ;和LeFranc MP(2001)“ Nomenclature ofthe human immunoglobulin lambda (IGL) genes(A 免疫球蛋白λ (IGL)基因的命名)· Exp Clin Immunogenet. ; 18 :242_254 ;以及對(duì)于V κ SchableiB Zachau (1993), "The variable genes of the human immunoglobulin kappa locus (人免疫球蛋白κ基因座的可變基因),”Biol.Chem Hoppe Seyler. 374(11) 1001-22 ;Brensing_Kiippers 等人(1997), "The human immunoglobulin kappa locus on yeast artificial chromosomes (YACs)(在酵母人工染色體(YAC)上的人免疫球蛋白κ 基因座)”Gene. 191(2) 173-81 ;Kawasaki 等人(2001),‘‘Evolutionary dynamics of the human immunoglobulin kappa locus and thegermline repertoire of the Vkappa genes(人免疫球蛋白κ基因座和Vk基因的種系組庫(kù)的進(jìn)化動(dòng)態(tài))”Eur J Immunol 31(4) 1017-28 ;禾口 Lefranc MP(2001) “ Nomenclature of the human immunoglobulin kappa(IGK) genes (人免疫球蛋白 κ (IGK)基因的命名)〃 Exp Clin Immunogenet.,18, 161-174,由此通過(guò)引用將它們?nèi)恳哉w并入??勺冎劓湹腏H4、可變?chǔ)瘦p鏈的Jk 1、以及可變?chǔ)溯p鏈區(qū)的JX 2/3的序列在以下出版物中描述:Scaviner 等人,(1999),“ Protein displays ofthe human immunoglobulin heavy, kappa and lambda variable and j oining regions ( 球蛋白重鏈、κ和λ鏈可變區(qū)和接合區(qū)的蛋白展示)“Exp Clin Immunogenet. 16 (4) 234-40 ;X^tT JH :Ravetch ^X, (1981), "Structure of the human immunoglobulin mu locus characterization of embryonic and rearrangedj and D genes.(入;^ 求胃白mu基因座的結(jié)構(gòu)胚性的和重排的J和D基因的表征)”Cell 27 (3pt 2) :583_91 ;對(duì)于 JK :Hieter 等人(1982), "Evolution of human immunoglobulin kappa J region genes. (人免疫球蛋白1^了區(qū)基因的進(jìn)化)”了 Biol Chem 257(3) :1516_22 ;對(duì)于JL :Kawasaki等人’ (1997) “One-Megabase Sequence Analysis of the Human immunoglobulin lambda Gene Locus(人免疫球蛋白λ基因座的一兆堿基序列分析)”Genome Research 7(3) 250-61,通過(guò)引用它們?nèi)恳哉w并入本文。JH4序列是(YFDYWGQGTLVTVSS) Jk 1序列是 (WTFGQGTKVEIK);并且 J λ 2/3 序列是(WFGGGTKLTVL)。術(shù)語(yǔ)“依賴于位置的氨基酸利用”是指特定氨基酸序列在多肽中的給定位置出現(xiàn)的可能性。在本發(fā)明中,對(duì)于通過(guò)個(gè)體種系基因分類的重排氨基酸序列確定了依賴于位置的氨基酸利用。這使得CDR在其天然的種系環(huán)境中的個(gè)性、精確的設(shè)計(jì)成為可能。術(shù)語(yǔ)“可變結(jié)構(gòu)域/區(qū)(VH或VL) ”表示包括基本上由分別組成輕鏈(包括κ和 λ )和重鏈免疫球蛋白基因座的VL (包括Vk和V λ )、VH、JL (包括Jk和J λ )以及JH核酸中的任何一個(gè)編碼的一個(gè)或多個(gè)Ig結(jié)構(gòu)域的免疫球蛋白的區(qū)域。輕鏈或重鏈可變區(qū)(VL和 VH)由散布三個(gè)稱為“互補(bǔ)決定區(qū)”或“⑶R”的高變區(qū)的“構(gòu)架”區(qū)或“FR”區(qū)組成。構(gòu)架區(qū)和 CDR 的范圍已被精確地定義(見(jiàn) Kabat,1991,J. Immunol.,147,915-920. ;Chothia & Lesk, 1987,J. Mol.Biol. 196 :901_917 ;Chothia 等人,1989,Nature 342 :877_883 ;Al-Lazikani 等人,1997,J. Mol. Biol. 273 :927_948)??贵w的構(gòu)架區(qū)即組分輕鏈和重鏈的聯(lián)合構(gòu)架區(qū)用來(lái)安置和對(duì)齊⑶R,⑶R主要負(fù)責(zé)與抗原結(jié)合。術(shù)語(yǔ)“構(gòu)架區(qū)”表示被Kabat等人(1991)定義為充當(dāng)可變結(jié)構(gòu)域的抗原結(jié)合環(huán)的支架的這種可變結(jié)構(gòu)域的一部分的抗體可變結(jié)構(gòu)域。構(gòu)架區(qū)的實(shí)例包括可變重鏈或可變輕鏈的 FR1、FR2、FR3 和 FR4。
20
術(shù)語(yǔ)“互補(bǔ)決定區(qū)”或“⑶R”表示由Kabat等人(1991)定義的抗體的抗原結(jié)合環(huán)。 抗體Fv片段的兩個(gè)可變結(jié)構(gòu)域的每一個(gè)包含三個(gè)⑶R?;パa(bǔ)決定區(qū)包括可變重鏈或可變輕鏈的 CDR1、CDR2 和 CDR3。“優(yōu)選的VH和VL類對(duì)”表示那些在免疫組庫(kù)中優(yōu)選的VH和VL類對(duì),所述免疫組庫(kù)例如根據(jù)標(biāo)準(zhǔn)閾值組的人免疫組庫(kù)。例如,豐富的VH-VL對(duì);或具有有利的生物物理特性如低免疫原性、穩(wěn)定性的VH-VL對(duì);容易被展示和/或表達(dá)的VH-VL對(duì);或者以在約2500個(gè)人B細(xì)胞的樣品中至少0. 05%的濃度出現(xiàn)的VH-VL對(duì)。在人免疫組庫(kù)中優(yōu)選的VH和VL類對(duì)可具有勝過(guò)其他VH和VL類對(duì)的優(yōu)選的特征。術(shù)語(yǔ)“幼稚”表示未經(jīng)歷抗原的。術(shù)語(yǔ)“幼稚B細(xì)胞”表示如下B細(xì)胞其中編碼抗體或其功能片段的核酸沒(méi)有經(jīng)歷體細(xì)胞超突變,因此被認(rèn)為包括種系基因的核酸,存在V(D) J基因區(qū)段重排。被認(rèn)為幼稚的 B細(xì)胞群是未成熟的B細(xì)胞、新的遷移B細(xì)胞和成熟的幼稚B細(xì)胞。術(shù)語(yǔ)“幼稚的人免疫組庫(kù)(nai've human immune r印ertoire),,表示分離自人免疫系統(tǒng)的未經(jīng)歷抗原的B細(xì)胞的核酸的組庫(kù),其中編碼抗體或其功能片段的核酸沒(méi)有經(jīng)歷體細(xì)胞超突變,因此被認(rèn)為包括種系基因的核酸,存在V(D) J基因區(qū)段重排。組庫(kù)可以是個(gè)體或群體的組庫(kù)。只要獲得足夠的B細(xì)胞,本發(fā)明順從于從單個(gè)個(gè)體確定免疫組庫(kù)。優(yōu)選地,從多個(gè)個(gè)體獲得免疫組庫(kù)以避免樣品偏倚。術(shù)語(yǔ)“人免疫組庫(kù)(human immune repertoire) ”表示分離自人免疫系統(tǒng)的B細(xì)胞的核酸的組庫(kù)。組庫(kù)可以是個(gè)體或群體的組庫(kù),并且可以來(lái)自于幼稚B細(xì)胞和/或經(jīng)歷抗原的B細(xì)胞。只要獲得足夠的B細(xì)胞,本發(fā)明順從于從單個(gè)個(gè)體確定免疫組庫(kù)。優(yōu)選地,從多個(gè)個(gè)體獲得免疫組庫(kù)以避免樣品偏倚。將“抗原”和“免疫原”定義為被抗體特異性結(jié)合的任何分子。術(shù)語(yǔ)“對(duì)免疫原特異的”表示在抗體與相應(yīng)分子之間的特異性關(guān)聯(lián)。如本文所用的“⑶R多樣化”或“多樣的⑶R”是通過(guò)任何適合的方法對(duì)⑶R的氨基酸序列的修飾。CDR—般已知是免疫原結(jié)合區(qū),因此具有包含代表CDR中的較大多樣性的成員的集合提高了集合將包括對(duì)于任何免疫原具有特異性和最佳特性的抗體或其片段的概率。通過(guò)改變一個(gè)或多個(gè)CDR的氨基酸組成而獲得多樣性。這可以通過(guò)本領(lǐng)域技術(shù)人員已知的任何方法達(dá)成,包括本文所述的方法?!熬幋a抗體或其片段的合成核酸的集合”表示編碼該抗體或其片段的所有核酸是合成的,但不是指可與這些合成的核酸可操作地連接的其他核酸,如載體。在分子生物學(xué)上下文中使用的術(shù)語(yǔ)術(shù)語(yǔ)“合成”或“合成了”表示基因合成,其中核酸序列被合成為物理DNA,包括多核苷酸。標(biāo)準(zhǔn)的DNA合成包括單核苷酸合成,其中產(chǎn)生單鏈寡核苷酸,然后利用PCR樣組件連接重疊的寡核苷酸。公司如 Sloning (Puchheim, Germany) >Geneart (Regensburg, Germany)、 DNA2. 0 (Menlo Park, CAUSA)和 Genscript (Piscataway,NJ USA)提供了基因合成技術(shù)。例如,Sloning利用一組事先制備的雙鏈三聯(lián)體核苷酸,這些核苷酸退火并隨后被連接。術(shù)語(yǔ)“合成的”描述了通過(guò)合成制備或被合成的分子。術(shù)語(yǔ)“集合(collection)”或“文庫(kù)”表示至少兩個(gè)成員。術(shù)語(yǔ)“成員”包括但不限于編碼抗體或其片段的核酸或者抗體或其片段本身。
術(shù)語(yǔ)“宿主”是指任何宿主,包括哺乳動(dòng)物,如人、鼠類或嚙齒動(dòng)物,小鼠、大鼠、松鼠、花栗鼠、囊地鼠、豪豬、河貍、倉(cāng)鼠、沙土鼠、豚鼠、兔、狗、貓、?;蝰R。術(shù)語(yǔ)“核酸”在本文可與術(shù)語(yǔ)“多核苷酸”互換使用,并且是指處于單鏈或雙鏈形式的脫氧核糖核苷酸或核糖核苷酸及其聚合物。該術(shù)語(yǔ)涵蓋包含已知的核苷酸類似物或修飾的骨架殘基或連接的核酸,這些核酸是合成的、天然存在的和非天然存在的,具有與參考核酸相似的結(jié)合特性。這些類似物的實(shí)例包括但不限于硫代磷酸酯、氨基磷酸酯、甲基膦酸酯、手性甲基膦酸酯、2-0-甲基核糖核苷酸以及肽-核酸(PNA)。除非另外指明,否則特定的核酸序列還隱含地涵蓋其保守修飾的變體(例如,簡(jiǎn)并密碼子取代)和互補(bǔ)序列以及明確指出的序列。具體地說(shuō),如以下所述,簡(jiǎn)并密碼子取代可通過(guò)如下方式達(dá)成產(chǎn)生其中一個(gè)或多個(gè)選擇的(或全部的)密碼子的第三個(gè)位置被混合堿基和/或脫氧肌苷殘基取代的序列(Batzer等人,Nucleic Acid Res. 19 :5081,1991 ; Ohtsuka 等人,J. Biol. Chem. 260 :2605_2608,1985 ;和 Rossolini 等人,Mol. Cell. Probes 8 91-98,1994)。術(shù)語(yǔ)“可操作地連接”是指在兩個(gè)或更多個(gè)多核苷酸(例如,DNA)區(qū)段之間的功能關(guān)系。通常,它是指轉(zhuǎn)錄調(diào)節(jié)序列與被轉(zhuǎn)錄的序列的功能關(guān)系。例如,如果啟動(dòng)子或增強(qiáng)子序列在適當(dāng)?shù)乃拗骷?xì)胞或其他表達(dá)系統(tǒng)中刺激或調(diào)控編碼序列的轉(zhuǎn)錄,那么啟動(dòng)子或增強(qiáng)子序列與該編碼序列可操作地連接。一般來(lái)說(shuō),與被轉(zhuǎn)錄的序列可操作地連接的啟動(dòng)子轉(zhuǎn)錄調(diào)節(jié)序列在物理上與該被轉(zhuǎn)錄的序列鄰接,即它們是順式作用的。然而,一些轉(zhuǎn)錄調(diào)節(jié)序列如增強(qiáng)子不必與它們?cè)鰪?qiáng)轉(zhuǎn)錄的編碼序列物理上鄰接或位置上很靠近。如本文所用,術(shù)語(yǔ)“密碼子優(yōu)化的”或“密碼子優(yōu)化”表示已利用在生產(chǎn)細(xì)胞或生物中優(yōu)選的密碼子改變核苷酸序列來(lái)編碼氨基酸序列。優(yōu)化的核苷酸序列被工程化以保留最初由初始核苷酸序列編碼的氨基酸序列。此外,可將核苷酸序列設(shè)計(jì)成完全或盡可能不含抑制性基序、剪接位點(diǎn)、mRNA不穩(wěn)定性基序和不期望的限制酶切位點(diǎn)。還可以優(yōu)化核苷酸序列的GC含量、期望的限制酶切位點(diǎn)以及其他參數(shù)。可優(yōu)化序列在不同宿主中的表達(dá), 包括細(xì)菌細(xì)胞或真核細(xì)胞。由優(yōu)化的核苷酸序列編碼的氨基酸序列也被稱為優(yōu)化的。術(shù)語(yǔ)“氨基酸”是指天然存在的氨基酸和合成的氨基酸,以及以類似于天然存在的氨基酸的方式起作用的氨基酸類似物和氨基酸模擬物。天然存在的氨基酸是由遺傳密碼編碼的氨基酸,以及后來(lái)被修飾的那些氨基酸,例如,羥基脯氨酸、Y-羧基谷氨酸和0-磷酸絲氨酸。氨基酸類似物是指具有與天然存在的氨基酸相同的基本化學(xué)結(jié)構(gòu)(即,與氫、羧基、氨基和R基結(jié)合的α碳)的化合物,例如,高絲氨酸、正亮氨酸、甲硫氨酸亞砜、甲硫氨酸甲基硫鐺(methionine methyl sulfonium)。這些類似物具有修飾的R基(例如,正亮氨酸)或修飾的肽骨架,但保留了與天然存在的氨基酸相同的基本化學(xué)結(jié)構(gòu)。氨基酸模擬物是指具有與氨基酸的一般化學(xué)結(jié)構(gòu)不同的結(jié)構(gòu)但以類似于天然存在的氨基酸的方式起作用的化學(xué)化合物。術(shù)語(yǔ)“多肽”和“蛋白”在本文可互換使用,是指氨基酸殘基的聚合物。這些術(shù)語(yǔ)適用于其中一個(gè)或更多個(gè)氨基酸殘基是對(duì)應(yīng)的天然存在的氨基酸的人工化學(xué)模擬物的氨基酸聚合物,并適用于天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。除非另外指明,否則特定的多肽序列還隱含地涵蓋其保守修飾的變體。術(shù)語(yǔ)“保守修飾的變體”適用于氨基酸序列和核酸序列二者。就特定的核酸序列來(lái)說(shuō),保守修飾的變體是指那些編碼相同或基本上相同的氨基酸序列的核酸,或者在核酸不編碼氨基酸序列的情況下是指基本相同的序列。因?yàn)檫z傳密碼的簡(jiǎn)并性,大量功能相同的核酸編碼任何給定蛋白。例如,密碼子GCA、GCC、GCG和GCU都編碼氨基酸丙氨酸。因此, 在丙氨酸被密碼子指定的每個(gè)位置,該密碼子可被改變?yōu)樗龅娜魏螌?duì)應(yīng)密碼子而不改變所編碼的多肽。這種核酸變異是“沉默變異”,是一類保守修飾變異。本文編碼多肽的每個(gè)核酸序列還描述了該核酸的每種可能的沉默變異。技術(shù)人員將認(rèn)識(shí)到,核酸中的每個(gè)密碼子(除了通常是甲硫氨酸唯一密碼子的AUG和通常是色氨酸唯一密碼子的TGG之外)可被修飾產(chǎn)生功能相同的分子。因此,編碼多肽的核酸的每種沉默變異隱含在每個(gè)描述的序列中。對(duì)于多肽序列來(lái)說(shuō),“保守修飾的變體”包括導(dǎo)致氨基酸被化學(xué)上相似的氨基酸取代的對(duì)多肽序列的個(gè)體取代、缺失或添加。提供功能相似的氨基酸的保守取代表是本領(lǐng)域公知的。這些保守修飾的變體不包括但不排除本發(fā)明的多態(tài)變體、種間同源物和等位基因。 以下八組包括互相為保守取代的氨基酸1)丙氨酸(A)、甘氨酸(G) ;2)天冬氨酸(D)、谷氨酸(E) ;3)天冬酰胺(N)、谷氨酰胺(Q) ;4)精氨酸(R)、賴氨酸(K) ;5)異亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、纈氨酸(V) ;6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W) ;7)絲氨酸(S)、 蘇氨酸(T);和8)半胱氨酸(C)、甲硫氨酸(M)(見(jiàn),例如Creighton,Proteins (1984))。在一些實(shí)施方案中,術(shù)語(yǔ)“保守序列修飾”用來(lái)指如下氨基酸修飾不顯著影響或改變包含該氨基酸序列的抗體的結(jié)合特征的氨基酸修飾。術(shù)語(yǔ)“相同的”或“同一性”百分比在兩個(gè)或更多個(gè)核酸或多肽序列的上下文中是指相同的兩條或更多條序列或子序列。如果兩條序列在比較窗口或者在使用以下序列比較算法之一或通過(guò)人工比對(duì)和肉眼檢查所測(cè)量的指定區(qū)域比較和比對(duì)最大對(duì)應(yīng)性時(shí)具有指定百分比的相同氨基酸殘基或核苷酸(即,在限定的區(qū)域或者當(dāng)不限定時(shí)整個(gè)序列的60% 同一性、任選65%、70%、75%、80%、85%、90%、95%或99%同一性),那么這兩條序列是 “基本上相同的”。任選地,同一性在長(zhǎng)度為至少約50個(gè)核苷酸(或10個(gè)氨基酸)的區(qū)域, 或更優(yōu)選在長(zhǎng)度為100到500或1000或更多個(gè)核苷酸(或20、50、200或更多個(gè)氨基酸) 的區(qū)域存在。對(duì)于序列比較,通常一條序列用作與測(cè)試序列進(jìn)行比較的參考序列。當(dāng)使用序列比較算法時(shí),將測(cè)試序列和參考序列輸入計(jì)算機(jī)中,指定子序列坐標(biāo),如果必要的話, 指定序列算法程序參數(shù)。可使用缺省的程序參數(shù),或者可指定可選的參數(shù)。然后序列比較算法基于程序參數(shù)計(jì)算測(cè)試序列相對(duì)于參考序列的序列同一性百分比。如本文所用的“比較窗口”包括參考選自由20到600、通常約50到約200、更通常約100到約150組成的組的任何一個(gè)鄰接位置數(shù)目的區(qū)段,在比較窗口中在序列與參考序列被最佳地比對(duì)后可將該序列與參考序列的相同數(shù)目的鄰接位置進(jìn)行比較。用于比較的序列比對(duì)方法是本領(lǐng)域公知的。用于比較的序列的最佳比對(duì)可通過(guò)如下方式進(jìn)行例如, 通過(guò) Smith 和 Waterman (1970) Adv. App 1. Math. 2 :482c 的局部同源性算法,通過(guò) Needleman 和 Wunsch,J. Mol. Biol. 48 :443,1970 的同源性比對(duì)算法,通過(guò) Pearson 和 Lipman,Proc. Nat,1. Acad. Sci. USA 85 :2444,1988的相似性搜尋方法,通過(guò)這些算法的計(jì)算機(jī)實(shí)現(xiàn)(在 Wisconsin 遺傳性軟件包,Genetics Computer Group, 575Science Dr. , Madison, WI 中的GAP、BESTFIT、FASTA和TFASTA),或通過(guò)人工比對(duì)和肉眼檢查(見(jiàn),例如,Brent等人, Current Protocols in Molecular Biology (現(xiàn)代分子生物學(xué)實(shí)驗(yàn)技術(shù)),John Wiley&Sons,Inc. (2003))。適于確定序列同一性百分比和序列相似性百分比的算法的兩個(gè)實(shí)例是分別被描述于 Altschul 等人,Nucl. Acids Res. 25 :3389_3402,1977 和 Altschul 等人,J. Mol. Biol. 215 =403-410,1990中的BLAST和BLAST 2. 0算法。用于執(zhí)行BLAST分析的軟件是通過(guò)美國(guó)國(guó)立生物技術(shù)信息中心公開(kāi)可用的。這種算法包括首先通過(guò)識(shí)別問(wèn)詢序列中長(zhǎng)度 W的短字(word)來(lái)識(shí)別高得分序列對(duì)(HSP),該高得分序列對(duì)當(dāng)與數(shù)據(jù)庫(kù)序列中的相同長(zhǎng)度的字對(duì)齊時(shí)匹配或滿足某個(gè)正值閾值得分Τ。T被稱為相鄰字得分閾值(neighborhood word score threshold) (Altschul等人,上述)。這些最初的相鄰字命中(hit)充當(dāng)用于啟動(dòng)搜索的種子以尋找包含它們的更長(zhǎng)的HSP。字命中沿每條序列在兩個(gè)方向上延伸直到累計(jì)的比對(duì)得分可被增加為止。對(duì)于核苷酸序列,使用參數(shù)M(對(duì)一對(duì)匹配殘基的獎(jiǎng)勵(lì)得分;總是> 0)和N(對(duì)錯(cuò)配殘基的處罰得分;總是< 0)計(jì)算累計(jì)得分。對(duì)于氨基酸序列,使用評(píng)分矩陣來(lái)計(jì)算累計(jì)得分。當(dāng)發(fā)生以下情況時(shí)字命中在每個(gè)方向上的延伸停止累計(jì)比對(duì)得分從其所達(dá)到的最大值下降了量X ;由于一個(gè)或更多個(gè)負(fù)得分殘基比對(duì)的累計(jì),累計(jì)得分趨于零或零以下;或者到達(dá)任一條序列的末端。BLAST算法參數(shù)W、T和X決定比對(duì)的靈敏度和速度。BLASTN程序(對(duì)于核苷酸序列而言)使用字長(zhǎng)(W) 11,期望(E)10,M = 5, N = -4以及兩條鏈的比較作為缺省值。對(duì)于氨基酸序列,BLASTP程序使用字長(zhǎng)(W)3,和期望(E) 10 以及 BL0SUM62 評(píng)分矩陣(參見(jiàn) Henikoff 和 Henikoff,Proc. Natl. Acad. Sci. USA 89 10915,1989),比對(duì)(B) 50,期望(E) 10,M = 5,N = -4和兩條鏈的比較作為缺省值。BLAST算法還進(jìn)行兩條序列之間的相似性的統(tǒng)計(jì)分析(見(jiàn),例如,Kar 1 in和 Altschul,Proc. Natl. Acad. Sci. USA 90 :5873_5787,1993)。由 BLAST算法提供的一種相似性量度是最小和概率(P(N)),它提供了在兩條核苷酸序列或氨基酸序列之間的匹配將偶然發(fā)生的概率的指示。例如,如果在測(cè)驗(yàn)核酸與參考核酸的比較中最小和概率小于大約0. 2、 更優(yōu)選地小于大約0. 01、并且最優(yōu)選地小于大約0. 001,那么認(rèn)為該核酸與參考序列是相似的。兩條氨基酸序列之間的同一性百分比還可以使用已被加入ALIGN程序(2. 0版) 中的 E. Meyers 和 W. Miller 的算法(Comput. Appl. Biosci.,4 :11_17,1988)確定,使用 PAMl20殘基權(quán)重表、空位長(zhǎng)度罰分12和空位罰分4。此外,兩條氨基酸序列之間的同一性百分比可使用已被加入GCG軟件包的GAP程序(在www. gcg. com可獲得)中的Needleman 和 Wunsch(J. Mol. Biol. 48 444-453,1970)算法確定,使用 Blossom 62 矩陣或 PAM250 矩陣,以及空位權(quán)重(gap weight) 16、14、12、10、8、6 或 4,以及長(zhǎng)度權(quán)重(length weight) U 2、3、4、5 或 6。除了以上指出的序列同一性百分比外,兩條核酸序列或多肽基本上相同的另一個(gè)指征是由第一核酸編碼的多肽與針對(duì)由第二核酸編碼的多肽而產(chǎn)生的抗體有免疫交叉反應(yīng),如以下所述。因此,多肽通常與另一多肽基本上相同,例如,在這兩條多肽差異僅為保守取代的情況下。兩條核酸序列基本上相同的另一指征是這兩個(gè)分子或它們的互補(bǔ)序列在嚴(yán)格條件下彼此雜交,如以下所述。兩條核酸序列基本上相同的又另一個(gè)指征是可使用相同的引物來(lái)擴(kuò)增該序列。術(shù)語(yǔ)“重組的宿主細(xì)胞”(或簡(jiǎn)稱“宿主細(xì)胞”)是指重組表達(dá)載體已被引入其中的細(xì)胞。應(yīng)理解這些術(shù)語(yǔ)不僅意指特定的受試細(xì)胞而且意指這種細(xì)胞的子代。因?yàn)槟承┬?br> 24飾由于突變或環(huán)境影響可發(fā)生在隨后的代中,所以這種子代事實(shí)上可與母本細(xì)胞不同,但是仍被包括在本文所用的術(shù)語(yǔ)“宿主細(xì)胞”的范圍之內(nèi)。典型的宿主細(xì)胞是原核的(如細(xì)菌的,包括但不限于大腸桿菌)或真核的(其包括酵母、哺乳動(dòng)物細(xì)胞和更多)。術(shù)語(yǔ)“載體”意指如下多核苷酸分子所述多核苷酸分子能夠運(yùn)輸與其連接的另一個(gè)多核苷酸。優(yōu)選的載體是能夠自主復(fù)制和/或表達(dá)與其連接的核酸的那些載體。能夠指導(dǎo)與其可操作地連接的核酸的表達(dá)的載體在本文被稱為“表達(dá)載體”。一種類型的載體是 “質(zhì)粒”,是指附加的DNA區(qū)段可被連入其中的環(huán)狀雙鏈DNA環(huán)。另一種類型的載體是病毒載體,其中附加的DNA區(qū)段可被連入該病毒的基因組中。某些載體能夠在它們被引入的宿主細(xì)胞中自主復(fù)制(例如,具有細(xì)菌的復(fù)制起點(diǎn)的細(xì)菌載體和附加型哺乳動(dòng)物載體)。其他載體(例如,非附加型哺乳動(dòng)物載體)可在引入宿主細(xì)胞中后被整合到宿主細(xì)胞的基因組中,從而與宿主基因組一起復(fù)制。此外,某些載體能夠指導(dǎo)與其可操作地連接的基因的表達(dá)。這些載體在本文稱為“重組表達(dá)載體”(或簡(jiǎn)稱“表達(dá)載體”)。一般來(lái)說(shuō),在重組DNA 技術(shù)中有實(shí)用性的表達(dá)載體通常處于質(zhì)粒形式。在本說(shuō)明書(shū)中,“質(zhì)粒”和“載體”可被互換使用,因?yàn)橘|(zhì)粒是最常用的載體形式。然而,本發(fā)明旨在包括具有同等功能的那些其他形式的表達(dá)載體,如病毒載體(例如,復(fù)制缺陷型逆轉(zhuǎn)錄病毒、腺病毒以及腺伴隨病毒)。載體通常包括原核復(fù)制子,原核復(fù)制子可包括能夠在細(xì)菌宿主細(xì)胞中指導(dǎo)編碼VH 和/或VL的同源物的表達(dá)(轉(zhuǎn)錄和翻譯)的原核啟動(dòng)子,所述細(xì)菌宿主細(xì)胞例如用編碼VH 和/或VL的同源物轉(zhuǎn)化的大腸桿菌(Escherichia coli)。啟動(dòng)子是允許RNA聚合酶的結(jié)合和轉(zhuǎn)錄發(fā)生的由DNA序列形成的表達(dá)控制元件。與細(xì)菌宿主相容的啟動(dòng)子序列通常被提供在包含用于插入DNA區(qū)段的便利限制酶切位點(diǎn)的質(zhì)粒載體中。這些載體質(zhì)粒的實(shí)例包括可商購(gòu)的 PUC8、pUC9、pBR322 和 pBR329、pPL 以及 pKK223?!罢故据d體”包括具有指導(dǎo)重組DNA分子在宿主細(xì)胞中在染色體外復(fù)制和維持的能力的DNA序列,所述宿主細(xì)胞例如用重組DNA分子轉(zhuǎn)化的細(xì)菌宿主細(xì)胞。這些DNA序列是本領(lǐng)域公知的。展示載體可以是例如起源于fd、M13或fl絲狀噬菌體類別的噬菌體載體或噬菌粒載體。這些載體能夠促進(jìn)蛋白(包括,例如,結(jié)合蛋白或其片段)在絲狀噬菌體表面上的展示。適合于在噬菌體、核糖體、DNA、細(xì)菌細(xì)胞或真核細(xì)胞(例如酵母或哺乳動(dòng)物細(xì)胞)上展示的展示載體也是本領(lǐng)域公知的,例如,是病毒載體或編碼嵌合蛋白的載體。“唯一的”限制酶切位點(diǎn)是在給定的核酸分子上只存在或出現(xiàn)一次的限制酶切位點(diǎn)ο集合及其生產(chǎn)和使用方法本公開(kāi)內(nèi)容使得可用于鑒定針對(duì)任何靶的治療性抗體的抗體或其功能片段的集合成為可能,其中所述抗體在臨床上可開(kāi)發(fā)并且在患者中是安全且有效的。作為背景,發(fā)明人設(shè)想在人免疫組庫(kù)中富含的可變重鏈和可變輕鏈種系基因?qū)赡芫哂杏欣纳镂锢硖匦裕瑢?dǎo)致更有效率的研發(fā),提高得到的抗體在患者中的安全性和效力。每個(gè)B細(xì)胞編碼一種抗體,并且每種抗體包含可變重鏈和可變輕鏈??蓪⒖贵w的可變重鏈和可變輕鏈中的每一個(gè)與種系基因序列比對(duì)以確定抗體的起源,意味著可變重鏈和可變輕鏈由哪些種系基因形成。因此,對(duì)于每種抗體而言,可以說(shuō),可變重鏈和可變輕鏈構(gòu)成種系基因?qū)?,例如?VH3-23與VK1-5配對(duì)。這種有利的生物物理特性可包括a)以Fab形式的相對(duì)高的展示率;b)相對(duì)高的Fab表達(dá)水平;c) Fab的溫度穩(wěn)定性;d)Fab的牛/小鼠血清穩(wěn)定性;e)相對(duì)高的人IgGl表達(dá)水平;和f)人IgGl的牛血清穩(wěn)定性。為了證實(shí)種系基因?qū)赡芫哂杏欣纳镂锢硖匦缘募僭O(shè),第一步是鑒定在人免疫組庫(kù)中表達(dá)的可變重鏈和可變輕鏈種系基因?qū)?。在一些方面,本發(fā)明包括產(chǎn)生合成抗體或其功能片段的集合的方法,所述方法包括獲得包括人免疫組庫(kù)中存在的可變重鏈和可變輕鏈種系基因?qū)Φ臄?shù)據(jù)的步驟。在一些實(shí)施方案中,數(shù)據(jù)是從提供可變重鏈和可變輕鏈種系基因?qū)Φ墓_(kāi)可用的文獻(xiàn)中獲得。一般來(lái)說(shuō),在相關(guān)的公開(kāi)可用的文獻(xiàn)中,遵循以下方法從人供體中分離B細(xì)胞,分選B細(xì)胞以確定其發(fā)育或分化的階段,產(chǎn)生并擴(kuò)增代表編碼來(lái)自每個(gè)B細(xì)胞的抗體的DNA的cDNA,對(duì)該cDNA測(cè)序,將編碼可變重鏈和可變輕鏈的cDNA 與已知的種系基因序列比對(duì),并確定來(lái)自每個(gè)B細(xì)胞的種系基因?qū)?。在一些?shí)施方案中,數(shù)據(jù)是從人B細(xì)胞的采樣和分離獲得的,其包括與文獻(xiàn)中使用的方法類似的方法。在這些方面,生產(chǎn)合成抗體或其功能片段的集合的方法包括獲得包含存在于人免疫組庫(kù)中的可變重鏈和可變輕鏈種系基因?qū)Φ臄?shù)據(jù)的步驟;其中該獲得步驟還包括如下步驟aa)從樣品中分離人B細(xì)胞;ab)從該B細(xì)胞產(chǎn)生cDNA ;ac) PCR擴(kuò)增來(lái)自B細(xì)胞的cDNA ;ad)對(duì)PCR產(chǎn)物進(jìn)行測(cè)序;和ae)鑒定PCR產(chǎn)物的種系基因。兩個(gè)數(shù)據(jù)集提供了人免疫組庫(kù)中存在的可變重鏈和可變輕鏈種系基因?qū)ΑO乱徊?,匯集、分析原始數(shù)據(jù),并根據(jù)表達(dá)水平對(duì)存在于人免疫組庫(kù)中的可變重鏈和可變輕鏈種系基因?qū)M(jìn)行分級(jí)。在這些方面,本發(fā)明包括產(chǎn)生抗體或其功能片段的集合的方法,所述方法包括鑒定在人免疫組庫(kù)中被突出表達(dá)的可變重鏈和可變輕鏈種系基因?qū)?。在人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)倪@個(gè)數(shù)據(jù)很清楚的是,某些可變重鏈和可變輕鏈種系基因?qū)Ρ绕渌N系對(duì)更頻繁地存在于人免疫組庫(kù)中。因?yàn)檫@些突出的對(duì)預(yù)期具有優(yōu)異的生物物理特性,所以本發(fā)明的方面包括源自在人免疫組庫(kù)中突出的種系基因?qū)Φ暮铣煽贵w或其功能片段的集合,其中在一些實(shí)施方案中,這些抗體或其功能片段的一個(gè)或更多個(gè)構(gòu)架區(qū)和/或互補(bǔ)決定區(qū)源自于在人免疫組庫(kù)中突出的種系基因?qū)ΑT谄渌矫?,本發(fā)明包括含在人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ幕旧系姆N系蛋白序列的合成抗體或其功能片段的集合,其中在一些實(shí)施方案中,這些抗體或其功能片段的一個(gè)或更多個(gè)構(gòu)架區(qū)和/或互補(bǔ)決定區(qū)包括在人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ幕旧系姆N系蛋白序列。在其他方面,本發(fā)明包括含在人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ姆N系蛋白序列的合成抗體或其功能片段的集合,其中在一些實(shí)施方案中,這些抗體或其功能片段的一個(gè)或更多個(gè)構(gòu)架區(qū)和/或互補(bǔ)決定區(qū)包括在人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ姆N系蛋白序列。在一些方面,本發(fā)明包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的合成抗體或其功能片段的集合,其中所述構(gòu)架區(qū)包括種系蛋白對(duì)的種系蛋白序列,其中所述種系基因在人免疫組庫(kù)中被突出表達(dá)。在一些實(shí)施方案中,本發(fā)明包括合成抗體或其功能片段的集合,其中所述可變重鏈和可變輕鏈構(gòu)架區(qū)基本上由在人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ姆N系蛋白序列組成。在一些實(shí)施方案中,抗體或其功能片段基本上由在人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)M成,其中在一些實(shí)施方案中,一個(gè)或更多個(gè)⑶R基本上由在人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ姆N系蛋白序列組成。在一些實(shí)施方案中,本發(fā)明包括合成抗體或其功能片段的集合,其中所述可變重鏈和可變輕鏈構(gòu)架區(qū)由在人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ姆N系蛋白序列組成。在一些實(shí)施方案中,抗體或其功能片段由在人免疫組庫(kù)中被突出表達(dá)的種系蛋白對(duì)所編碼的種系蛋白對(duì)組成,其中在一些實(shí)施方案中,一個(gè)或更多個(gè) CDR基本上由在人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ姆N系蛋白序列組成。在一些實(shí)施方案中,這些集合的大多數(shù)或基本上全部的抗體或其功能片段包括在人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ姆N系蛋白序列。在一些實(shí)施方案中,在人免疫組庫(kù)中豐富的或被突出表達(dá)的種系基因?qū)σ匀缦聺舛缺磉_(dá)在人免疫組庫(kù)中至少0. 05%,在人免疫組庫(kù)中至少0. 09% ;在人免疫組庫(kù)中至少 0. 14% ;在人免疫組庫(kù)中至少0. 19% ;在人免疫組庫(kù)中至少0. 23% ;在人免疫組庫(kù)中至少 0. 28% ;在人免疫組庫(kù)中至少0. 33% ;在人免疫組庫(kù)中至少0. 37% ;在人免疫組庫(kù)中至少 0. 42% ;在人免疫組庫(kù)中至少0. 47% ;在人免疫組庫(kù)中至少0. 51% ;在人免疫組庫(kù)中至少 0. 56% ;在人免疫組庫(kù)中至少0. 61% ;在人免疫組庫(kù)中至少0. 66% ;在人免疫組庫(kù)中至少 0. 70% ;在人免疫組庫(kù)中至少0. 84% ;在人免疫組庫(kù)中至少0. 89% ;在人免疫組庫(kù)中至少
0.94% ;在人免疫組庫(kù)中至少1.03% ;在人免疫組庫(kù)中至少1. 12% ;在人免疫組庫(kù)中至少
1.17% ;或在人免疫組庫(kù)中至少1. 26%。本發(fā)明的另外一方面是集合可用于鑒定針對(duì)任何免疫原的抗體或其功能片段的能力。根據(jù)CDR長(zhǎng)度和在構(gòu)象或規(guī)范結(jié)構(gòu)上的多樣性,認(rèn)為產(chǎn)生具有在人免疫組庫(kù)中被突出表達(dá)的至少兩個(gè)可變重鏈和可變輕鏈種系蛋白對(duì)的集合將提供在該集合中的多樣性,尤其是在該集合的抗體的互補(bǔ)決定區(qū)中的多樣性。這容許本發(fā)明的集合可用于鑒定針對(duì)任何免疫原的抗體或其功能片段。因此,本發(fā)明的一些方面包括含抗體或其功能片段的集合, 所述抗體或其功能片段包含如下數(shù)目的選自人免疫組庫(kù)的突出表達(dá)的種系蛋白對(duì)的不同的種系蛋白對(duì)至少兩個(gè)不同的種系蛋白對(duì);至少三個(gè)不同的種系蛋白對(duì);至少四個(gè)不同的種系蛋白對(duì);至少五個(gè)不同的種系蛋白對(duì);至少六個(gè)不同的種系蛋白對(duì);至少七個(gè)不同的種系蛋白對(duì);至少八個(gè)不同的種系蛋白對(duì);至少九個(gè)不同的種系蛋白對(duì);至少十個(gè)不同的種系蛋白對(duì);至少十一個(gè)不同的種系蛋白對(duì);至少十二個(gè)不同的種系蛋白對(duì);至少十三個(gè)不同的種系蛋白對(duì);至少十四個(gè)不同的種系蛋白對(duì);至少十五個(gè)不同的種系蛋白對(duì);至少十六個(gè)不同的種系蛋白對(duì);至少十七個(gè)不同的種系蛋白對(duì);至少十八個(gè)不同的種系蛋白對(duì);至少十九個(gè)不同的種系蛋白對(duì);至少二十個(gè)不同的種系蛋白對(duì);至少21個(gè)不同的種系蛋白對(duì);至少22個(gè)不同的種系蛋白對(duì);至少23個(gè)不同的種系蛋白對(duì);至少24個(gè)不同的種系蛋白對(duì);至少25個(gè)不同的種系蛋白對(duì);至少26個(gè)不同的種系蛋白對(duì);至少27個(gè)不同的種系蛋白對(duì);至少28個(gè)不同的可變重鏈種系蛋白;至少29個(gè)不同的種系蛋白對(duì)序列;至少 30個(gè)不同的種系蛋白對(duì);至少31個(gè)不同的種系蛋白對(duì);至少32個(gè)不同的種系蛋白對(duì);至少 33個(gè)不同的種系蛋白對(duì);至少34個(gè)不同的種系蛋白對(duì);至少35個(gè)不同的種系蛋白對(duì);至少 36個(gè)不同的種系蛋白對(duì);至少37個(gè)不同的種系蛋白對(duì);至少38個(gè)不同的種系蛋白對(duì);至少 39個(gè)不同的種系蛋白對(duì);至少40個(gè)不同的種系蛋白對(duì);至少41個(gè)不同的種系蛋白對(duì);至少 42個(gè)不同的種系蛋白對(duì);至少43個(gè)不同的種系蛋白對(duì);至少44個(gè)不同的可變重鏈種系蛋白;至少45個(gè)不同的種系蛋白對(duì)序列;至少46個(gè)不同的種系蛋白對(duì);至少47個(gè)不同的種系蛋白對(duì);至少48個(gè)不同的種系蛋白對(duì);至少49個(gè)不同的種系蛋白對(duì);或至少50個(gè)不同的種系蛋白對(duì)。在一些實(shí)施方案中,集合包括含選自表18所示的種系基因?qū)Φ囊粋€(gè)或更多個(gè)種系蛋白對(duì)的可變重鏈和可變輕鏈構(gòu)架區(qū)。在一些實(shí)施方案中,本發(fā)明包括分離的抗體或其功能片段,所述分離的抗體或其功能片段包含可變重鏈結(jié)構(gòu)域和可變輕鏈結(jié)構(gòu)域,所述可變重鏈結(jié)構(gòu)域和可變輕鏈結(jié)構(gòu)域包含F(xiàn)Rl、CDRl、FR2、CDR2和FR3,所述FRl、CDRl、FR2、CDR2和FR3包含種系基因?qū)Φ姆N系蛋白序列,其中所述種系基因?qū)x自表18的種系基因?qū)?。在幼稚的人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)€預(yù)料某些可變重鏈和可變輕鏈種系基因?qū)稍谟字葿細(xì)胞(未經(jīng)歷抗原的)與經(jīng)歷抗原的B細(xì)胞中差異地表達(dá),因此,基于采樣的B細(xì)胞的發(fā)育或分化來(lái)分析數(shù)據(jù)。包含在幼稚B細(xì)胞中被差異表達(dá)的種系基因?qū)Φ姆N系蛋白對(duì)的集合可能在選擇針對(duì)任何免疫原的抗體或其功能片段上是有利的。因此,本發(fā)明的方面包括源自于在幼稚的人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ暮铣煽贵w或其功能片段的集合,其中在一些實(shí)施方案中,這些抗體或其功能片段的一個(gè)或更多個(gè)構(gòu)架區(qū)和/或互補(bǔ)決定區(qū)源自于在幼稚的人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)?。在其他方面,本發(fā)明包括含在幼稚的人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ幕旧系姆N系蛋白序列的合成抗體或其功能片段的集合,其中在一些實(shí)施方案中,這些抗體或其功能片段的一個(gè)或更多個(gè)構(gòu)架區(qū)和/或互補(bǔ)決定區(qū)包括在幼稚的人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ幕旧系姆N系蛋白序列。在其他方面,本發(fā)明包括含在幼稚的人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ姆N系蛋白序列的合成抗體或其功能片段的集合,其中在一些實(shí)施方案中,這些抗體或其功能片段的一個(gè)或更多個(gè)構(gòu)架區(qū)和/或互補(bǔ)決定區(qū)包括在幼稚的人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ姆N系蛋白序列。 在一些方面,本發(fā)明包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的合成抗體或其功能片段的集合, 其中所述構(gòu)架區(qū)包括種系蛋白序列,其中所述種系蛋白序列包括可變重鏈和可變輕鏈種系蛋白對(duì),其中所述種系蛋白對(duì)由在幼稚的人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)幋a。在一些實(shí)施方案中,本發(fā)明包括合成抗體或其功能片段的集合,其中所述可變重鏈和可變輕鏈構(gòu)架區(qū)基本上由在幼稚的人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ姆N系蛋白序列組成。在一些實(shí)施方案中,抗體或其功能片段基本上由如下種系蛋白對(duì)組成所述種系蛋白對(duì)由在幼稚的人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)幋a。在一些實(shí)施方案中,本發(fā)明包括合成抗體或其功能片段的集合,其中所述可變重鏈和可變輕鏈構(gòu)架區(qū)由在幼稚的人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ姆N系蛋白序列組成。在一些實(shí)施方案中,抗體或其功能片段由如下種系蛋白對(duì)組成所述種系蛋白對(duì)由在幼稚的人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)幋a。在一些實(shí)施方案中,這些集合的大多數(shù)或基本上全部的抗體或其功能片段包括在幼稚的人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)Φ姆N系蛋白序列。在一些實(shí)施方案中,在幼稚的人免疫組庫(kù)中豐富的或被突出表達(dá)的種系基因?qū)σ匀缦聺舛缺磉_(dá)在幼稚的人免疫組庫(kù)中至少0. 07%,在幼稚的人免疫組庫(kù)中至少0. 15% ; 在幼稚的人免疫組庫(kù)中至少0. 22% ;在幼稚的人免疫組庫(kù)中至少0. 30% ;在幼稚的人免疫組庫(kù)中至少0. 37% ;在幼稚的人免疫組庫(kù)中至少0. 45% ;在幼稚的人免疫組庫(kù)中至少 0. 52% ;在幼稚的人免疫組庫(kù)中至少0. 59% ;在幼稚的人免疫組庫(kù)中至少0. 67% ;在幼稚的人免疫組庫(kù)中至少0. 74% ;在幼稚的人免疫組庫(kù)中至少0. 82% ;在幼稚的人免疫組庫(kù)中至少0. 89% ;在幼稚的人免疫組庫(kù)中至少0. 97% ;在幼稚的人免疫組庫(kù)中至少1. 19% ;或在幼稚的人免疫組庫(kù)中至少1. 56%。
本發(fā)明的另外一方面是集合可用于鑒定針對(duì)任何免疫原的抗體或其功能片段的能力。根據(jù)CDR長(zhǎng)度和在構(gòu)象或規(guī)范結(jié)構(gòu)上的多樣性,認(rèn)為產(chǎn)生具有在幼稚的人免疫組庫(kù)中被突出表達(dá)的種系基因?qū)λ幋a的至少兩個(gè)可變重鏈和可變輕鏈種系蛋白對(duì)的集合將提供在該集合中的多樣性,尤其是在該集合的抗體的互補(bǔ)決定區(qū)中的多樣性。這容許本發(fā)明的集合可用于鑒定針對(duì)任何免疫原的抗體或其功能片段。因此,本發(fā)明的一些方面包括含抗體或其功能片段的集合,所述抗體或其功能片段包含如下數(shù)目的不同的種系蛋白對(duì): 至少兩個(gè)不同的種系蛋白對(duì);至少三個(gè)不同的種系蛋白對(duì);至少四個(gè)不同的種系蛋白對(duì); 至少五個(gè)不同的種系蛋白對(duì);至少六個(gè)不同的種系蛋白對(duì);至少七個(gè)不同的種系蛋白對(duì); 至少八個(gè)不同的種系蛋白對(duì);至少九個(gè)不同的種系蛋白對(duì);至少十個(gè)不同的種系蛋白對(duì); 至少十一個(gè)不同的種系蛋白對(duì);至少十二個(gè)不同的種系蛋白對(duì);至少十三個(gè)不同的種系蛋白對(duì);至少十四個(gè)不同的種系蛋白對(duì);至少十五個(gè)不同的種系蛋白對(duì);至少十六個(gè)不同的種系蛋白對(duì);至少十七個(gè)不同的種系蛋白對(duì);至少十八個(gè)不同的種系蛋白對(duì);至少十九個(gè)不同的種系蛋白對(duì);至少二十個(gè)不同的種系蛋白對(duì);至少21個(gè)不同的種系蛋白對(duì);至少22 個(gè)不同的種系蛋白對(duì);至少23個(gè)不同的種系蛋白對(duì);至少24個(gè)不同的種系蛋白對(duì);至少25 個(gè)不同的種系蛋白對(duì);至少26個(gè)不同的種系蛋白對(duì);至少27個(gè)不同的種系蛋白對(duì);至少28 個(gè)不同的可變重鏈種系蛋白;至少29個(gè)不同的種系蛋白對(duì)序列;至少30個(gè)不同的種系蛋白對(duì);至少31個(gè)不同的種系蛋白對(duì);至少32個(gè)不同的種系蛋白對(duì);至少33個(gè)不同的種系蛋白對(duì);至少34個(gè)不同的種系蛋白對(duì);至少35個(gè)不同的種系蛋白對(duì);至少36個(gè)不同的種系蛋白對(duì);至少37個(gè)不同的種系蛋白對(duì);至少38個(gè)不同的種系蛋白對(duì);至少39個(gè)不同的種系蛋白對(duì);至少40個(gè)不同的種系蛋白對(duì);至少41個(gè)不同的種系蛋白對(duì);至少42個(gè)不同的種系蛋白對(duì);至少43個(gè)不同的種系蛋白對(duì);至少44個(gè)不同的可變重鏈種系蛋白;至少45 個(gè)不同的種系蛋白對(duì)序列;至少46個(gè)不同的種系蛋白對(duì);至少47個(gè)不同的種系蛋白對(duì);至少48個(gè)不同的種系蛋白對(duì);至少49個(gè)不同的種系蛋白對(duì);或至少50個(gè)不同的種系蛋白對(duì)。在一些實(shí)施方案中,集合包括含選自表19的種系基因?qū)Φ囊粋€(gè)或更多個(gè)種系蛋白對(duì)的可變重鏈和可變輕鏈構(gòu)架區(qū)。在一些實(shí)施方案中,本發(fā)明包括分離的抗體或其功能片段,所述分離的抗體或其功能片段包含可變重鏈結(jié)構(gòu)域和可變輕鏈結(jié)構(gòu)域,所述可變重鏈結(jié)構(gòu)域和可變輕鏈結(jié)構(gòu)域包含F(xiàn)Rl、CDRl、FR2、CDR2和FR3,所述FRl、CDRl、FR2、CDR2和FR3包含構(gòu)成種系蛋白對(duì)的種系蛋白序列,其中所述種系蛋白對(duì)選自表19的種系基因?qū)ΑT谌嗣庖呓M庫(kù)中被突出表達(dá)的可變重鏈、可變?chǔ)瘦p鏈、以及可變?chǔ)溯p鏈種系基因下一步,分析匯集數(shù)據(jù)和附加的數(shù)據(jù)以確定在人免疫組庫(kù)中可變重鏈、可變?chǔ)瘦p鏈、和可變?chǔ)溯p鏈的種系基因表達(dá)。因此,本發(fā)明的額外方面包括產(chǎn)生抗體或其功能片段的集合的方法,所述方法包括鑒定在人免疫組庫(kù)中被突出表達(dá)的可變重鏈、可變?chǔ)瘦p鏈、 和可變?chǔ)溯p鏈種系基因的步驟。這樣做的一個(gè)途徑是基于可變重鏈、可變?chǔ)瘦p鏈、和可變 λ輕鏈種系基因的表達(dá)水平將它們排序。包含由在人免疫組庫(kù)中被突出表達(dá)的種系基因編碼的可變重鏈或可變輕鏈種系蛋白序列的抗體可能具有增強(qiáng)研發(fā)及在患者中的安全性和效力的有利生物物理特性。因此,本發(fā)明的方面包括源自于在人免疫組庫(kù)中被突出表達(dá)的可變重鏈或可變輕鏈種系基因的合成抗體或其功能片段的集合,其中在一些實(shí)施方案中,這些抗體或其功能片段的一個(gè)
29或更多個(gè)構(gòu)架區(qū)和/或互補(bǔ)決定區(qū)源自于在人免疫組庫(kù)中被突出表達(dá)的可變重鏈或可變輕鏈種系基因。在其他方面,本發(fā)明包括含在人免疫組庫(kù)中被突出表達(dá)的可變重鏈或可變輕鏈種系基因的基本上的種系蛋白序列的合成抗體或其功能片段的集合,其中在一些實(shí)施方案中,這些抗體或其功能片段的一個(gè)或更多個(gè)構(gòu)架區(qū)和/或互補(bǔ)決定區(qū)包含在幼稚的人免疫組庫(kù)中被突出表達(dá)的可變重鏈或可變輕鏈種系基因的基本上的種系蛋白序列。在其他方面,本發(fā)明包括含在人免疫組庫(kù)中被突出表達(dá)的可變重鏈或可變輕鏈種系基因的種系蛋白序列的合成抗體或其功能片段的集合,其中在一些實(shí)施方案中,這些抗體或其功能片段的一個(gè)或更多個(gè)構(gòu)架區(qū)和/或互補(bǔ)決定區(qū)包含在人免疫組庫(kù)中被突出表達(dá)的可變重鏈或可變輕鏈種系基因的種系蛋白序列。在一些方面,本發(fā)明包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的合成抗體或其功能片段的集合,其中所述構(gòu)架區(qū)包括種系蛋白序列,其中所述種系蛋白序列由在人免疫組庫(kù)中被突出表達(dá)的可變重鏈或可變輕鏈種系基因編碼。在一些實(shí)施方案中,本發(fā)明包括合成抗體或其功能片段的集合,其中所述可變重鏈和可變輕鏈構(gòu)架區(qū)基本上由在人免疫組庫(kù)中被突出表達(dá)的可變重鏈或可變輕鏈種系基因的種系蛋白序列組成。在一些實(shí)施方案中,抗體或其功能片段基本上由如下可變重鏈或可變輕鏈種系蛋白序列組成所述種系蛋白序列由在幼稚的人免疫組庫(kù)中被突出表達(dá)的種系基因編碼。在一些實(shí)施方案中,本發(fā)明包括合成抗體或其功能片段的集合,其中所述可變重鏈和可變輕鏈構(gòu)架區(qū)由在人免疫組庫(kù)中被突出表達(dá)的可變重鏈或可變輕鏈種系基因的種系蛋白序列組成。在一些實(shí)施方案中,抗體或其功能片段由如下可變重鏈或可變輕鏈種系蛋白序列組成所述種系蛋白序列由在人免疫組庫(kù)中被突出表達(dá)的種系基因編碼。在一些實(shí)施方案中,這些集合的大多數(shù)或基本上全部的抗體或其功能片段包括在幼稚的人免疫組庫(kù)中被突出表達(dá)的種系基因編碼的種系蛋白序列。在一些實(shí)施方案中,在人免疫組庫(kù)中豐富的或被突出表達(dá)的可變重鏈種系基因以如下濃度表達(dá)在人免疫組庫(kù)中至少0. ;在人免疫組庫(kù)中至少0.2% ;在人免疫組庫(kù)中至少0. 3% ;在人免疫組庫(kù)中至少0. 4% ;在人免疫組庫(kù)中至少0. 5% ;在人免疫組庫(kù)中至少0. 6% ;在人免疫組庫(kù)中至少1. 0% ;在人免疫組庫(kù)中至少1. 6% ;在人免疫組庫(kù)中至少2.1% ;在人免疫組庫(kù)中至少2.2% ;在人免疫組庫(kù)中至少2.6% ;在人免疫組庫(kù)中至少2. 7% ;在人免疫組庫(kù)中至少3.0% ;在人免疫組庫(kù)中至少3.2% ;在人免疫組庫(kù)中至少3. 3% ;在人免疫組庫(kù)中至少4.0% ;在人免疫組庫(kù)中至少4. ;在人免疫組庫(kù)中至少4. 5% ;在人免疫組庫(kù)中至少4. 6% ;在人免疫組庫(kù)中至少5. 3% ;在人免疫組庫(kù)中至少 5.8% ;或在人免疫組庫(kù)中至少6. 8% ;在人免疫組庫(kù)中至少7.6% ;在人免疫組庫(kù)中至少 8.0% ;或在人免疫組庫(kù)中至少10.6%。在一些實(shí)施方案中,在人免疫組庫(kù)中豐富的或被突出表達(dá)的可變?chǔ)瘦p鏈種系基因以如下濃度表達(dá)在人免疫組庫(kù)中至少0. 1%,在人免疫組庫(kù)中至少0.2% ;在人免疫組庫(kù)中至少0. 3% ;在人免疫組庫(kù)中至少0. 4% ;在人免疫組庫(kù)中至少0. 5% ;在人免疫組庫(kù)中至少0.7% ;在人免疫組庫(kù)中至少1.0% ;在人免疫組庫(kù)中至少1. 1% ;在人免疫組庫(kù)中至少1. 3% ;在人免疫組庫(kù)中至少1. 9% ;在人免疫組庫(kù)中至少2. 2% ;在人免疫組庫(kù)中至少2. 4% ;在人免疫組庫(kù)中至少2. 6% ;在人免疫組庫(kù)中至少4. 6% ;在人免疫組庫(kù)中至少6. 0% ;在人免疫組庫(kù)中至少7. 6% ;在人免疫組庫(kù)中至少8. 5% ;在人免疫組庫(kù)中至少 11. 1% ;在人免疫組庫(kù)中至少11. 2% ;在人免疫組庫(kù)中至少14. 2% ;或在人免疫組庫(kù)中至少 16. 2%。在一些實(shí)施方案中,在人免疫組庫(kù)中豐富的或被突出表達(dá)的可變?chǔ)溯p鏈種系基因以如下濃度表達(dá)在人免疫組庫(kù)中至少0. 1%,在人免疫組庫(kù)中至少0. 3% ;在人免疫組庫(kù)中至少0. 5% ;在人免疫組庫(kù)中至少0. 6% ;在人免疫組庫(kù)中至少1. 0% ;在人免疫組庫(kù)中至少1. 2% ;在人免疫組庫(kù)中至少1. 5% ;在人免疫組庫(kù)中至少1. 7% ;在人免疫組庫(kù)中至少4. 5% ;在人免疫組庫(kù)中至少5. 1% ;在人免疫組庫(kù)中至少5. 3% ;在人免疫組庫(kù)中至少 6.5% ;在人免疫組庫(kù)中至少8. 1% ;在人免疫組庫(kù)中至少10.0% ;或在人免疫組庫(kù)中至少 11. 3% ;或在人免疫組庫(kù)中至少18. 1%。本發(fā)明的另外一方面是集合可用于鑒定針對(duì)任何免疫原的抗體或其功能片段的能力。認(rèn)為產(chǎn)生具有在人免疫組庫(kù)中被突出表達(dá)的一個(gè)或更多個(gè)可變重鏈、可變?chǔ)瘦p鏈和可變?chǔ)溯p鏈種系基因的集合將產(chǎn)生在該集合中的多樣性,尤其是在CDR長(zhǎng)度和在構(gòu)象或規(guī)范結(jié)構(gòu)上的多樣性,由此使得該集合可用于鑒定針對(duì)任何免疫原的抗體或其功能片段。本發(fā)明的實(shí)施方案包括含抗體或其功能片段的集合,所述抗體或其功能片段包含如下數(shù)目的不同的可變重鏈種系蛋白序列至少兩種不同的可變重鏈種系蛋白序列;至少三種不同的可變重鏈種系蛋白序列;至少四種不同的可變重鏈種系蛋白序列;至少五種不同的可變重鏈種系蛋白序列;至少六種不同的可變重鏈種系蛋白序列;至少七種不同的可變重鏈種系蛋白序列;至少八種不同的可變重鏈種系蛋白序列;至少九種不同的可變重鏈種系蛋白序列;至少十種不同的可變重鏈種系蛋白序列;至少十一種不同的可變重鏈種系蛋白序列; 至少十二種不同的可變重鏈種系蛋白序列;至少十三種不同的可變重鏈種系蛋白序列;至少十四種不同的可變重鏈種系蛋白序列;至少十五種不同的可變重鏈種系蛋白序列;至少十六種不同的可變重鏈種系蛋白序列;至少十七種不同的可變重鏈種系蛋白序列;至少十八種不同的可變重鏈種系蛋白序列;至少十九種不同的可變重鏈種系蛋白序列;至少二十種不同的可變重鏈種系蛋白序列;至少21種不同的可變重鏈種系蛋白序列;至少22 種不同的可變重鏈種系蛋白序列;至少23種不同的可變重鏈種系蛋白序列;至少24種不同的可變重鏈種系蛋白序列;至少25種不同的可變重鏈種系蛋白序列;至少26種不同的可變重鏈種系蛋白序列;至少27種不同的可變重鏈種系蛋白序列;至少28種不同的可變重鏈種系蛋白;至少29種不同的可變重鏈種系蛋白序列;至少30種不同的可變重鏈種系蛋白序列;至少31種不同的可變重鏈種系蛋白序列;至少32種不同的可變重鏈種系蛋白序列;至少33種不同的可變重鏈種系蛋白序列;至少34種不同的可變重鏈種系蛋白序列; 至少35種不同的可變重鏈種系蛋白序列;至少36種不同的可變重鏈種系蛋白序列;至少 37種不同的可變重鏈種系蛋白序列;至少38種不同的可變重鏈種系蛋白序列;至少39種不同的可變重鏈種系蛋白序列;至少40種不同的可變重鏈種系蛋白序列;至少41種不同的可變重鏈種系蛋白序列;至少42種不同的可變重鏈種系蛋白序列;至少43種不同的可變重鏈種系蛋白序列;至少44種不同的可變重鏈種系蛋白;至少45種不同的可變重鏈種系蛋白序列;至少46種不同的可變重鏈種系蛋白序列;至少47種不同的可變重鏈種系蛋白序列;至少48種不同的可變重鏈種系蛋白序列;至少49種不同的可變重鏈種系蛋白序列。本發(fā)明的實(shí)施方案包括含抗體或其功能片段的集合,所述抗體或其功能片段包含如下數(shù)目的不同的可變?chǔ)瘦p鏈種系蛋白序列至少兩種可變?chǔ)瘦p鏈種系蛋白序列;至少三種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少四種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少五種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少六種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少七種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少八種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少九種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少十種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少十一種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少十二種不同的可變?chǔ)瘦p鏈種系蛋白序列; 至少十三種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少十四種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少十五種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少十六種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少十七種不同的可變K輕鏈種系蛋白序列;至少十八種不同的可變K輕鏈種系蛋白序列;至少十九種不同的可變K輕鏈種系蛋白序列;至少二十種不同的可變K輕鏈種系蛋白序列;至少21種不同的可變K輕鏈種系蛋白序列;至少22種不同的可變K 輕鏈種系蛋白序列;至少23種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少24種不同的可變?chǔ)?輕鏈種系蛋白序列;至少25種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少26種不同的可變?chǔ)?輕鏈種系蛋白序列;至少27種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少28種不同的可變?chǔ)?輕鏈種系蛋白;至少29種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少30種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少31種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少32種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少33種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少34種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少35種不同的可變?chǔ)瘦p鏈種系蛋白序列。本發(fā)明的實(shí)施方案包括含抗體或其功能片段的集合,所述抗體或其功能片段包含如下數(shù)目的不同的可變?chǔ)溯p鏈種系蛋白序列至少兩種不同的可變?chǔ)溯p鏈種系蛋白序列; 至少三種不同的可變?chǔ)溯p鏈種系蛋白序列;至少四種不同的可變?chǔ)溯p鏈種系蛋白序列; 至少五種不同的可變?chǔ)溯p鏈種系蛋白序列;至少六種不同的可變?chǔ)溯p鏈種系蛋白序列; 至少七種不同的可變?chǔ)溯p鏈種系蛋白序列;至少八種不同的可變?chǔ)溯p鏈種系蛋白序列; 至少九種不同的可變?chǔ)溯p鏈種系蛋白序列;至少十種不同的可變?chǔ)溯p鏈種系蛋白序列; 至少十一種不同的可變?chǔ)溯p鏈種系蛋白序列;至少十二種不同的可變?chǔ)溯p鏈種系蛋白序列;至少十三種不同的可變?chǔ)溯p鏈種系蛋白序列;至少十四種不同的可變?chǔ)溯p鏈種系蛋白序列;至少十五種不同的可變?chǔ)溯p鏈種系蛋白序列;至少十六種不同的可變?chǔ)溯p鏈種系蛋白序列;至少十七種不同的可變?chǔ)溯p鏈種系蛋白序列;至少十八種不同的可變?chǔ)溯p鏈種系蛋白序列;至少十九種不同的可變?chǔ)溯p鏈種系蛋白序列;至少二十種不同的可變?chǔ)?輕鏈種系蛋白序列;至少21種不同的可變?chǔ)溯p鏈種系蛋白序列;至少22種不同的可變?chǔ)?輕鏈種系蛋白序列;至少23種不同的可變?chǔ)溯p鏈種系蛋白序列;至少24種不同的可變?chǔ)?輕鏈種系蛋白序列;至少25種不同的可變?chǔ)溯p鏈種系蛋白序列;至少26種不同的可變?chǔ)?輕鏈種系蛋白序列;至少27種不同的可變?chǔ)溯p鏈種系蛋白序列;至少28種不同的可變?chǔ)?輕鏈種系蛋白;至少29種不同的可變?chǔ)溯p鏈種系蛋白序列;至少30種不同的可變?chǔ)溯p鏈種系蛋白序列;至少31種不同的可變?chǔ)溯p鏈種系蛋白序列;至少32種不同的可變?chǔ)溯p鏈種系蛋白序列;至少33種不同的可變?chǔ)溯p鏈種系蛋白序列。在一些實(shí)施方案中,集合包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的抗體或其功能片段,其中所述構(gòu)架區(qū)包括選自由以下組成的組的一種或更多種可變重鏈種系蛋白序列 IGHV3-23 ;IGHV3-30 ;IGHV4-39 ;IGHV4-34 ; IGHV4-59 ; IGHV1-69 ;IGHV5-51 ; IGHV3-7 ; IGHV1-18 ; IGHV3-48 ; IGHV3-15 ; IGHV3-21 ; IGHV1-2 ; IGHV3-33 ; IGHV4-31 ; IGHV3-53 ;IGHV3-11 ; IGHV3-9 ; IGHV4-4 ; IGHV1-46 ; IGHV3-74 ; IGHV1-24 ; IGHV4-61 ; IGHV1-8 ; IGHV1-3 ; IGHV3-49 ; IGHV3-43 ; IGHV4-28 ; IGHV3-64 ;和 IGHV7-81。在一些實(shí)施方案中,集合包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的抗體或其功能片段,其中所述構(gòu)架區(qū)包括選自由以下組成的組的一種或更多種可變?chǔ)瘦p鏈種系蛋白序列 IGKV3-20 ;IGKV1-39/1D-39;IGKV1-5 ;IGKV3-15 ; IGKV4-1 ; IGKV3-11 ; IGKV2-28/2D-28; IGKV1-33/1D-33 ; IGKV2-30 ; IGKV1-9 ;IGKV1-17 ; IGKV1-27;IGKV1-8 ;IGKV1-16 ; IGKV1-6 ; IGKV1-12 ; IGKV2D-29 ; IGKV1-13 ; IGKV1D-8 ;和 IGKV2-24。在一些實(shí)施方案中,集合包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的抗體或其功能片段,其中所述構(gòu)架區(qū)包括選自由以下組成的組的一種或更多種可變?chǔ)溯p鏈種系蛋白序列 JGLV2-14;IGLV1-40 ; IGLV1-44 ;IGLV1-51 ; IGLV2-23 ; IGLV3-21 ;IGLV1-47 ; IGLV3-1 ; IGLV2-11 ; IGLV2-8 ; IGLV6-57 ; IGLV3-25 ; IGLV7-46 ;IGLV1-36 ; IGLV7-43 ; IGLV9-49 ; IGLV4-69 ; IGLV2-18 ; IGLV3-10 ;禾口 IGLV3-27。在一些實(shí)施方案中,本發(fā)明包括含F(xiàn)R1、⑶Rl、FR2、⑶R2和FR3的分離的抗體或其功能片段,所述FRl、CDRl、FR2、CDR2和FR3包含選自由以下組成的組的種系蛋白序列IGHV3-23 ;IGHV3-30 ;IGHV4-39 ;IGHV4-34 ;IGHV4-59 ;IGHVl-69 IGHV5-51 ; IGHV3-7 ;IGHV1-18 ; IGHV3-48 ;IGHV3-15 ; IGHV3-21 ;IGHV1-2 ; IGHV3-33 IGHV4-31 ;IGHV3-53 ;IGHV3-11 ;IGHV3-9 ;IGHV4-4 ;IGHV1-46 ;IGHV3-74 ;IGHV1-24 IGHV4-61 ;IGHV1-8 ;IGHV1-3 ;IGHV3-49 ;IGHV3-43 ;IGHV4-28 ;IGHV3-64 ;IGHV7-81 IGKV3-20 ;IGKV1-39/1D-39 ;IGKV1-5 ; IGKV3-15 ; IGKV4-1 ; IGKV3-11 ; IGKV2-28/2D-28 IGKV1-33/1D-33 ;IGKV2-30;IGKV1-9 ;IGKV1-17 ; IGKV1-27 ; IGKV1-8 ;IGKV1-16 ; IGKV1-6 IGKV1-12 ; IGKV2D-29 ;IGKV1-13 ; IGKV1D-8;IGKV2-24 ; IGLV2-14 ; IGLV1-40 ; IGLV1-44 IGLV1-51 ; IGLV2-23 ;IGLV3-21 ;IGLV1-47 ; IGLV3-1 ; IGLV2-11 ; IGLV2-8 ; IGLV6-57 IGLV3-25;IGLV7-46 ; IGLV1-36 ; IGLV7-43 ; IGLV9-49 ; IGLV4-69 ; IGLV2-18 ; IGLV3-10 ;和 IGLV3-27。具有有利的生物物理特性的可變重鏈、可變?chǔ)瘦p鏈和可變?chǔ)溯p鏈種系基因下一步,評(píng)估突出的可變重鏈、可變?chǔ)瘦p鏈和可變?chǔ)溯p鏈種系蛋白序列以確定其與研發(fā)相關(guān)的生物物理特性。經(jīng)由計(jì)算機(jī)模擬評(píng)估了可變重鏈、可變?chǔ)瘦p鏈和可變?chǔ)溯p鏈種系蛋白序列的以下特性CDR長(zhǎng)度;等電點(diǎn)(pi),優(yōu)選的等電點(diǎn)是7. 5或以上,因?yàn)檫@應(yīng)該提供在標(biāo)準(zhǔn)的PH 5.5到?!1 7配制緩沖液中的穩(wěn)定性;在互補(bǔ)決定區(qū)中的翻譯后修飾 (PTM)(具體地說(shuō),N連接的糖基化位點(diǎn)(NxS或NxT)或化學(xué)修飾如Asp切割(通常在DP), Asp異構(gòu)化(DD,DG),脫酰胺作用(NS,NG)(這可在體內(nèi)(在血清中)或在儲(chǔ)存時(shí)在配制緩沖液中發(fā)生并且導(dǎo)致抗體結(jié)合的喪失);在CDR中甲硫氨酸的存在(當(dāng)暴露于溶劑時(shí)可被氧化);未成對(duì)的半胱氨酸的存在(將與任何其他未成對(duì)的半胱氨酸形成二硫鍵,由此導(dǎo)致蛋白的交聯(lián)和/或較低的表達(dá)水平);偏離種系;潛在的T細(xì)胞表位的存在;以及理論上的聚集傾向。在一些實(shí)施方案中,本發(fā)明包括產(chǎn)生合成抗體或其功能片段的集合的方法,所述方法包括如下步驟a)鑒定包含如下特性的可變重鏈和/或可變輕鏈種系蛋白序列i) 在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸; iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;ν)中等或低的聚集傾向;和vi)至少7. 5的等電點(diǎn);和b)產(chǎn)生含在a)中鑒定的可變重鏈和/或可變輕鏈種系基因序列的抗體或其功能片段的集合。本發(fā)明的方面包括源自于具有一種或多種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列的合成抗體或其功能片段的集合i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸; iv) 一個(gè)或更少的潛在T細(xì)胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點(diǎn),其中在一些實(shí)施方案中,這些抗體或其功能片段的一個(gè)或更多個(gè)構(gòu)架區(qū)和/或互補(bǔ)決定區(qū)源自于具有這些特性的可變重鏈和/或可變輕鏈種系蛋白序列。本發(fā)明的方面包括合成抗體或其功能片段的集合,所述合成抗體或其功能片段包括具有一種或多種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列的基本上的種系蛋白序列i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點(diǎn),其中在一些實(shí)施方案中,這些抗體或其功能片段的一個(gè)或更多個(gè)構(gòu)架區(qū)和/或互補(bǔ)決定區(qū)包括來(lái)自具有這些特性的可變重鏈和/或可變輕鏈種系蛋白序列的基本上的種系蛋白序列。本發(fā)明的方面包括合成抗體或其功能片段的集合,所述合成抗體或其功能片段包括具有一種或多種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列的種系蛋白序列i) 在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸; iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點(diǎn),其中在一些實(shí)施方案中,這些抗體或其功能片段的一個(gè)或更多個(gè)構(gòu)架區(qū)和/或互補(bǔ)決定區(qū)包括具有這些特性的可變重鏈和/或可變輕鏈種系蛋白的種系蛋白序列。本發(fā)明的方面包括合成抗體或其功能片段的集合,所述合成抗體或其功能片段包括不含未成對(duì)半胱氨酸的可變重鏈和/或可變輕鏈種系蛋白序列。本發(fā)明的方面包括含如下可變重鏈和/或可變輕鏈種系蛋白序列的合成抗體或其功能片段的集合所述可變重鏈和/或可變輕鏈種系蛋白序列包含互補(bǔ)決定區(qū)中的四個(gè)或更少的翻譯后修飾;互補(bǔ)決定區(qū)中的三個(gè)或更少的翻譯后修飾;互補(bǔ)決定區(qū)中的兩個(gè)或更少的翻譯后修飾;互補(bǔ)決定區(qū)中的一個(gè)或更少的翻譯后修飾;或互補(bǔ)決定區(qū)中無(wú)翻譯后修飾。本發(fā)明的方面包括源自于如下可變重鏈和/或可變輕鏈種系蛋白序列的合成抗體或其功能片段的集合所述可變重鏈和/或可變輕鏈種系蛋白序列包括至少7. 5的等電點(diǎn);至少8. 0的等電點(diǎn);至少8. 5的等電點(diǎn);至少9的等電點(diǎn);或至少9. 5的等電點(diǎn)。本發(fā)明的方面包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的合成抗體或其功能片段的集合,其中所述構(gòu)架區(qū)包括具有一種或更多種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點(diǎn)。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括具有至少兩種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點(diǎn)。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括具有至少四種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii) 在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點(diǎn)。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括具有至少四種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii) 在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點(diǎn)。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括具有至少五種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii) 在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點(diǎn)。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括具有如下特性的可變重鏈和/或可變輕鏈種系蛋白序列i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;ν)中等或低的聚集傾向;和vi)至少7. 5的等電點(diǎn)。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構(gòu)架區(qū),其中所述構(gòu)架區(qū)基本上由具有一種或更多種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列組成i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位; ν)中等或低的聚集傾向;或vi)至少7. 5的等電點(diǎn)。在一些實(shí)施方案中,抗體或其功能片段基本上由具有一種或多種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列組成i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii) 在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點(diǎn)。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構(gòu)架區(qū),其中所述構(gòu)架區(qū)由具有一種或更多種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列組成i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點(diǎn)。在一些實(shí)施方案中,抗體或其功能片段由具有一種或多種如下特性的可變重鏈和 /或可變輕鏈種系蛋白序列組成i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點(diǎn)。在一些實(shí)施方案中,這些集合的大多數(shù)或基本上全部的抗體或其功能片段包括具有一種或多種如下特性的可變重鏈和/或可變輕鏈種系蛋白序列i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未
35成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;ν)中等或低的聚集傾向;或vi)至少 7.5的等電點(diǎn)。一些實(shí)施方案包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的合成抗體或其功能片段的集合,其中所述構(gòu)架區(qū)包括種系蛋白序列,其中所述種系蛋白序列包含如下特性i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;和ν)至少7. 5的等電點(diǎn)。一些實(shí)施方案包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的合成抗體或其功能片段的集合,其中所述構(gòu)架區(qū)包括種系蛋白序列,其中所述種系蛋白序列包含如下特性i) 一個(gè)或更少的未成對(duì)半胱氨酸。一些實(shí)施方案包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的合成抗體或其功能片段的集合,其中所述構(gòu)架區(qū)包括種系蛋白序列,其中所述種系蛋白序列包含如下特性i) 一個(gè)或更少的未成對(duì)半胱氨酸;ii) 一個(gè)或更少的潛在T細(xì)胞表位。一些實(shí)施方案包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的合成抗體或其功能片段的集合,其中所述構(gòu)架區(qū)包括種系蛋白序列,其中所述種系蛋白序列包含如下特性i) 一個(gè)或更少的未成對(duì)半胱氨酸;ii) 一個(gè)或更少的潛在T細(xì)胞表位;和iii)至少7. 5的等電點(diǎn)。一些實(shí)施方案包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的合成抗體或其功能片段的集合,其中所述構(gòu)架區(qū)包括種系蛋白序列,其中所述種系蛋白序列包含如下特性i)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;ii) 一個(gè)或更少的未成對(duì)半胱氨酸;iii) 一個(gè)或更少的潛在T細(xì)胞表位;和iv)至少7. 5的等電點(diǎn)。本發(fā)明的另外一方面是集合可用于鑒定針對(duì)任何免疫原的抗體或其功能片段的能力。認(rèn)為產(chǎn)生具有一個(gè)或更多個(gè)可變重鏈、可變?chǔ)瘦p鏈和可變?chǔ)溯p鏈種系蛋白序列的集合將產(chǎn)生在該集合中的多樣性,尤其是在CDR長(zhǎng)度和在構(gòu)象或規(guī)范結(jié)構(gòu)上的多樣性,由此使得該集合可用于鑒定針對(duì)任何免疫原的抗體或其功能片段。本發(fā)明的實(shí)施方案包括含如下抗體或其功能片段的集合所述抗體或其功能片段包括如下數(shù)目的不同的可變重鏈種系蛋白序列至少兩種不同的可變重鏈種系蛋白序列; 至少三種不同的可變重鏈種系蛋白序列;至少四種不同的可變重鏈種系蛋白序列;至少五種不同的可變重鏈種系蛋白序列;至少六種不同的可變重鏈種系蛋白序列;至少七種不同的可變重鏈種系蛋白序列;至少八種不同的可變重鏈種系蛋白序列;至少九種不同的可變重鏈種系蛋白序列;至少十種不同的可變重鏈種系蛋白序列;至少十一種不同的可變重鏈種系蛋白序列;至少十二種不同的可變重鏈種系蛋白序列;至少十三種不同的可變重鏈種系蛋白序列;至少十四種不同的可變重鏈種系蛋白序列;至少十五種不同的可變重鏈種系蛋白序列;至少十六種不同的可變重鏈種系蛋白序列;至少十七種不同的可變重鏈種系蛋白序列;至少十八種不同的可變重鏈種系蛋白序列;至少十九種不同的可變重鏈種系蛋白序列;或至少二十種不同的可變重鏈種系蛋白序列,所述不同的可變重鏈種系蛋白序列包含如下特性i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;ν) 中等或低的聚集傾向;或vi)至少7. 5的等電點(diǎn)。本發(fā)明的實(shí)施方案包括含如下抗體或其功能片段的集合所述抗體或其功能片段包括如下數(shù)目的不同的可變?chǔ)瘦p鏈種系蛋白序列至少兩種不同的可變?chǔ)瘦p鏈種系蛋白29/172 頁(yè)
序列;至少三種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少四種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少五種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少六種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少七種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少八種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少九種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少十種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少十一種不同的可變?chǔ)瘦p鏈種系蛋白序列;至少十二種不同的可變?chǔ)瘦p鏈種系蛋白序列,所述不同的可變?chǔ)瘦p鏈種系蛋白序列包含如下特性i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5 的等電點(diǎn)。本發(fā)明的實(shí)施方案包括含如下抗體或其功能片段的集合所述抗體或其功能片段包括如下數(shù)目的不同的可變?chǔ)溯p鏈種系蛋白序列至少兩種不同的可變?chǔ)溯p鏈種系蛋白序列;至少三種不同的可變?chǔ)溯p鏈種系蛋白序列;至少四種不同的可變?chǔ)溯p鏈種系蛋白序列;至少五種不同的可變?chǔ)溯p鏈種系蛋白序列;至少六種不同的可變?chǔ)溯p鏈種系蛋白序列;至少七種不同的可變?chǔ)溯p鏈種系蛋白序列;至少八種不同的可變?chǔ)溯p鏈種系蛋白序列,所述不同的可變?chǔ)溯p鏈種系蛋白序列包含如下特性i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) —個(gè)或更少的潛在T細(xì)胞表位;ν)中等或低的聚集傾向;或vi)至少7. 5的等電點(diǎn)。在一些實(shí)施方案中,集合包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的抗體或其功能片段,其中所述構(gòu)架區(qū)包括選自由以下組成的組的一種或更多種可變重鏈種系蛋白序列IGHVl-2 ;IGHV1-18 ;IGHV1-69 ;IGHV1-46 ;IGHV3-7 ;IGHV3-11 ;IGHV3-15 ;IGHV3-21 ; IGHV3-23 ;IGHV3-30 ;IGHV3-33 ;IGHV3-48 ;IGHV3-53 ;IGHV3-73 ;IGH3-74 ;IGHV4-4 ; IGHV4-31 ; IGHV4-39 ; IGHV 5-51和 IGHV6-1。在一些實(shí)施方案中,集合包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的抗體或其功能片段,其中所述構(gòu)架區(qū)包括選自由以下組成的組的一種或更多種可變?chǔ)瘦p鏈種系蛋白序列IGKVl-5 ;IGKV1-6 ;IGKV1-9 ;IGKV1-12 ;IGKV1-16 ;IGKV1-17 ;IGKV1-27 ;IGKV1-39 ; IGKV2-30 ; IGKV3-11 ; IGKV3-15 ;和 IGKV3-20。在一些實(shí)施方案中,集合包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的抗體或其功能片段,其中所述構(gòu)架區(qū)包括選自由以下組成的組的一種或更多種可變?chǔ)溯p鏈種系蛋白序列 IGLV1-40 ; IGLV1-47 ;IGLV1-51 ; IGLV2-11 ; IGLV2-23 ; IGLV2-14 ; IGLV3-1 和 IGLV3-21。在一些實(shí)施方案中,本發(fā)明包括含F(xiàn)R1、⑶Rl、FR2、⑶R2和FR3的分離的抗體或其功能片段,所述FR1、⑶Rl、FR2、⑶R2和FR3包含選自由以下組成的組的種系蛋白序列 JGHV1-2 ;IGHV1-18 ; IGHV1-69 ; IGHV1-46 ; IGHV3-7 ; IGHV3-11 ;IGHV3-15 ; IGHV3-21 ; IGHV3-23 ;IGHV3-30 ;IGHV3-33 ;IGHV3-48 ;IGHV3-53 ;IGHV3-73 ;IGH3-74 ;IGHV4-4 ; IGHV4-31 ; IGHV4-39 ; IGHV 5-51 ; IGHV6-1 ; IGKV1-5 ;IGKV1-6 ; IGKV1-9 ; IGKV1-12 ; IGKV1-16 ;IGKV1-17 ;IGKV1-27 ; IGKV1-39 ; IGKV2-30 ; IGKV3-11 ;IGKV3-15 ; IGKV3-20 ; IGLV1-40 ; IGLV1-47 ; IGLV1-51 ; IGLV2-11 ;IGLV2-23 ; IGLV2-14 ; IGLV3-1 和 IGLV3-21。具有有利的生物物理特性的種系基因?qū)ο乱徊?,必須確定要測(cè)試哪些種系蛋白質(zhì)對(duì),因?yàn)樵谌嗣庖呓M庫(kù)中存在約2500
37對(duì)。一種方式是測(cè)試最突出地出現(xiàn)在人免疫組庫(kù)中的可變重鏈和可變輕鏈種系蛋白對(duì),例如,見(jiàn)表18。人們可例如選擇前四百對(duì)用于測(cè)試,或者選擇表達(dá)高于某個(gè)閾值濃度的可變重鏈和可變輕鏈種系蛋白對(duì)。因此,本發(fā)明的方面包括生產(chǎn)合成抗體或其功能片段的集合的方法,其中所述生產(chǎn)步驟還包括如下步驟鑒定以至少0. 05%的濃度在人免疫組庫(kù)中表達(dá)的可變重鏈和可變輕鏈種系基因?qū)Γ划a(chǎn)生包含所鑒定的種系蛋白對(duì)的抗體或其功能片段; 并且評(píng)估所述種系蛋白對(duì)的如下特性i)以Fab形式的相對(duì)展示率;ii)以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在 37°C持續(xù)大于十天的在牛血清中的穩(wěn)定性;ν)以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。這種方法將需要合成和測(cè)試大量可變重鏈和可變輕鏈種系蛋白對(duì)序列;因此,這種方法將不是非常有效率的。作為一種替代的方法,發(fā)明人選擇了代表、準(zhǔn)確地再現(xiàn)或覆蓋大多數(shù)來(lái)自人免疫組庫(kù)的突出表達(dá)的對(duì)的一小組可變重鏈和可變輕鏈種系對(duì)。這種方法部分上基于如下觀察結(jié)果少量可變重鏈、可變?chǔ)瘦p鏈和可變?chǔ)溯p鏈種系基因在人免疫組庫(kù)中占優(yōu)勢(shì)。Wildt 等人在895-896頁(yè)描述了這種現(xiàn)象。Wildt等人還說(shuō)明頻繁表達(dá)的重鏈和輕鏈基因區(qū)段通常是成對(duì)的,并且觀察到采樣的一半配對(duì)僅對(duì)應(yīng)于五個(gè)種系對(duì)。因此,可以聯(lián)合少量的突出表達(dá)的重鏈和輕鏈種系基因(未成對(duì)的)以產(chǎn)生一組代表人免疫組庫(kù)的對(duì)。因此,本發(fā)明的方面包括如下抗體或其片段的集合所述抗體或其片段包括代表、 準(zhǔn)確地再現(xiàn)或覆蓋人免疫組庫(kù)或幼稚的人免疫組庫(kù)的大多數(shù)突出表達(dá)的可變重鏈和可變輕鏈種系基因?qū)Φ姆N系蛋白對(duì)。如以下所述,隨著首先測(cè)試可變重鏈和可變輕鏈種系蛋白對(duì)的有利的生物物理特性,然后將集合設(shè)計(jì)成包括具有一種或更多種這些有利的生物物理特性的種系蛋白對(duì),我們的方法產(chǎn)生了包含可充分開(kāi)發(fā)的抗體或其片段的集合。本發(fā)明的方面包括生產(chǎn)抗體或其功能片段的集合的方法,所述方法包括鑒定具有一種或多種如下特性的可變重鏈和可變輕鏈種系蛋白對(duì)的步驟i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab pMxll_FH VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與 M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些方面,本發(fā)明包括生產(chǎn)抗體或其功能片段的集合的方法,所述方法包括產(chǎn)生含可變重鏈和可變輕鏈構(gòu)架區(qū)的抗體或其功能片段的集合,其中所述一種或更多種構(gòu)架區(qū)包括種系蛋白對(duì)的種系蛋白序列,其中所述種系蛋白對(duì)包括一種或更多種如下特性 i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1_69VLA_ V11-40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在 37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些實(shí)施方案中,F(xiàn)RU FR2和FR3區(qū)包括種系蛋白序列。在一些實(shí)施方案中,F(xiàn)Rl、FR2和FR3區(qū)包括種系蛋白對(duì)的種系蛋白序列。在一些實(shí)施方案中,抗體或其功能片段包括含種系蛋白序列的一個(gè)或更多個(gè)互補(bǔ)決定區(qū)。在一些實(shí)施方案中,抗體或其功能片段包括含種系蛋白對(duì)的種系蛋白序列的一個(gè)或更多個(gè)互補(bǔ)決定區(qū)。在一些實(shí)施方案中,⑶Rl區(qū)和⑶R2區(qū)包括種系蛋白序列。在一些實(shí)施方案中,⑶Rl 區(qū)和⑶R2區(qū)包括種系蛋白對(duì)的種系蛋白序列。在一些實(shí)施方案中,F(xiàn)RU⑶Rl、FR2、⑶R2 和FR3區(qū)包括種系蛋白序列。在一些實(shí)施方案中,F(xiàn)R1、⑶Rl、FR2、⑶R2和FR3區(qū)包括種系蛋白對(duì)的種系蛋白序列。在一些實(shí)施方案中,F(xiàn)R4區(qū)包括JH4重鏈區(qū)。在一些實(shí)施方案中, 尺4區(qū)包括了1^ 1輕鏈區(qū)。在一些實(shí)施方案中,F(xiàn)R4區(qū)包括JX 2/3輕鏈區(qū)。在其他實(shí)施方案中,本發(fā)明包括生產(chǎn)抗體或其功能片段的集合的方法,所述方法包括產(chǎn)生集合,其中產(chǎn)生還包括如下步驟合成編碼抗體或其功能片段的核酸;將核酸克隆到載體中;并且表達(dá)抗體或其功能片段。合成并測(cè)試可變重鏈和可變輕鏈種系蛋白對(duì)的突出表達(dá)的或代表的組后,然后可將集合設(shè)計(jì)成包括具有有利的生物物理特性的種系蛋白對(duì)。本發(fā)明的方面包括源自于具有一種或更多種如下特性的種系蛋白對(duì)的合成抗體或其功能片段的集合i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii) 與Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在 60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和 vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性,其中在一些實(shí)施方案中,抗體或其功能片段的一個(gè)或更多個(gè)構(gòu)架區(qū)和/或互補(bǔ)決定區(qū)源自于具有這些特性的種系蛋白對(duì)。本發(fā)明的方面包括如下合成抗體或其功能片段的集合所述合成抗體或其功能片段包括具有一種或更多種如下特性的種系蛋白對(duì)的基本上的種系蛋白序列i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與 M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性,其中在一些實(shí)施方案中,抗體或其功能片段的一個(gè)或更多個(gè)構(gòu)架區(qū)和/或互補(bǔ)決定區(qū)包括具有這些特性的種系蛋白對(duì)的基本上的種系蛋白序列。本發(fā)明的方面包括如下合成抗體或其功能片段的集合所述合成抗體或其功能片段包括具有一種或更多種如下特性的種系蛋白對(duì)的種系蛋白序列i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性; iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性,其中在一些實(shí)施方案中,抗體或其功能片段的一個(gè)或更多個(gè)構(gòu)架區(qū)和/或互補(bǔ)決定區(qū)包括具有這些特性的種系蛋白對(duì)的種系蛋白序列。在一些方面,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構(gòu)架區(qū),其中所述構(gòu)架區(qū)包括具有一種或更多種如下特性的種系蛋白對(duì)的種系蛋白序列i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν) 與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些實(shí)施方案中,包含種系蛋白對(duì)的種系蛋白序列的構(gòu)架區(qū)包括FR1、FR2和 FR3區(qū)。在一些實(shí)施方案中,抗體或其功能片段包括含種系蛋白序列的一個(gè)或更多個(gè)互補(bǔ)決定區(qū)。在一些實(shí)施方案中,抗體或其功能片段包括含種系蛋白對(duì)的種系蛋白序列的一個(gè)或更多個(gè)互補(bǔ)決定區(qū)。在一些實(shí)施方案中,⑶Rl區(qū)和⑶R2區(qū)包括種系蛋白序列。在一些實(shí)施方案中,⑶Rl區(qū)和⑶R2區(qū)包括種系蛋白對(duì)的種系蛋白序列。在一些實(shí)施方案中,F(xiàn)R1、 ⑶R1、FR2、⑶R2和FR3區(qū)包括種系蛋白序列。在一些實(shí)施方案中,F(xiàn)R1、⑶Rl、FR2、⑶R2和 FR3區(qū)包括種系蛋白對(duì)的種系蛋白序列。在一些實(shí)施方案中,F(xiàn)R4區(qū)包括JH4重鏈區(qū)。在一些實(shí)施方案中,F(xiàn)R4區(qū)包括Jk 1輕鏈區(qū)。在一些實(shí)施方案中,F(xiàn)R4區(qū)包括J λ 2/3輕鏈區(qū)。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構(gòu)架區(qū),其中所述構(gòu)架區(qū)包括具有至少兩種如下特性的種系蛋白對(duì)的種系蛋白序列i)以Fab 形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0.4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν) 與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構(gòu)架區(qū),其中所述構(gòu)架區(qū)包括具有至少三種如下特性的種系蛋白對(duì)的種系蛋白序列i)以Fab 形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0.4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν) 與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構(gòu)架區(qū),其中所述構(gòu)架區(qū)包括具有至少四種如下特性的種系蛋白對(duì)的種系蛋白序列i)以Fab 形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0.4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν) 與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構(gòu)架區(qū),其中所述構(gòu)架區(qū)包括具有至少五種如下特性的種系蛋白對(duì)的種系蛋白序列i)以Fab 形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0.4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν) 與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。
在一些實(shí)施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構(gòu)架區(qū),其中所述構(gòu)架區(qū)包括具有如下特性的種系蛋白對(duì)的種系蛋白序列i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與 M0R03080相比至少0.4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構(gòu)架區(qū),其中所述構(gòu)架區(qū)基本上由具有一種或更多種如下特性的種系蛋白對(duì)的種系蛋白序列組成i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1_69VLA_ V11-40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在 37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些實(shí)施方案中,抗體或其功能片段基本上由包括一種或更多種如下特性的種系蛋白對(duì)的種系蛋白序列組成i)以Fab形式的相對(duì)展示率包括在采樣的前75%Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab 形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構(gòu)架區(qū),其中所述構(gòu)架區(qū)由具有一種或更多種如下特性的種系蛋白對(duì)的種系蛋白序列組成 i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1_69VLA_ V11-40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在 37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些實(shí)施方案中,抗體或其功能片段由包括一種或更多種如下特性的種系蛋白對(duì)的種系蛋白序列組成i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii) 與Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在 60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和 vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些實(shí)施方案中,這些集合的大多數(shù)或基本上全部的抗體或其功能片段包括具有一種或更多種如下特性的種系蛋白對(duì)的種系蛋白序列i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以 Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些方面,集合的抗體或其功能片段包括具有一種或更多種如下特性的種系蛋白對(duì)的種系蛋白序列i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii) 與Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在 60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和 vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些實(shí)施方案中,抗體或其功能片段基本上由包括如下特性的種系蛋白對(duì)的種系蛋白序列組成i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以 IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些實(shí)施方案中,抗體或其功能片段由包括如下特性的種系蛋白對(duì)的種系蛋白序列組成i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以 IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構(gòu)架區(qū),其中所述可變重鏈構(gòu)架區(qū)和可變輕鏈構(gòu)架區(qū)包括種系蛋白對(duì)的種系蛋白序列,其中所述種系蛋白對(duì)包括如下特性i)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;和ii)以IgG形式在37°C持續(xù)十四天的在血清中的穩(wěn)定性。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構(gòu)架區(qū),其中所述可變重鏈構(gòu)架區(qū)和可變輕鏈構(gòu)架區(qū)包括種系蛋白對(duì)的種系蛋白序列,其中所述種系蛋白對(duì)包括如下特性i)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;ii)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;iii)以IgG 形式在37°C持續(xù)十四天的在血清中的穩(wěn)定性。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構(gòu)架區(qū),其中所述可變重鏈構(gòu)架區(qū)和可變輕鏈構(gòu)架區(qū)包括種系蛋白對(duì)的種系蛋白序列,其中所述種系蛋白對(duì)包括如下特性i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iii)以Fab形式在 37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;和iv)以IgG形式在37°C持續(xù)十四天的在血清中的穩(wěn)定性。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構(gòu)架區(qū),其中所述可變重鏈構(gòu)架區(qū)和可變輕鏈構(gòu)架區(qū)包括種系蛋白對(duì)的種系蛋白序列,其中所述種系蛋白對(duì)包括如下特性i)與Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達(dá)水平;ii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iii)以Fab 形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;iv)與M0R03080相比至少
420. 4的以IgG形式的表達(dá)水平;和ν)以IgG形式在37°C持續(xù)十四天的在血清中的穩(wěn)定性。在其他實(shí)施方案中,本發(fā)明的集合包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的合成抗體或其功能片段的集合,其中所述可變重鏈構(gòu)架區(qū)和可變輕鏈構(gòu)架區(qū)包括種系蛋白對(duì)的種系蛋白序列,其中所述種系蛋白對(duì)包括如下特性i)以Fab形式在60°C或更高溫度持續(xù)至少 45分鐘的熱穩(wěn)定性;ii)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;iii)與M0R03080相比至少0.4的以IgG形式的表達(dá)水平;和iv)以IgG形式在37°C持續(xù)十四天的在血清中的穩(wěn)定性。在其他實(shí)施方案中,本發(fā)明的集合和/或生產(chǎn)這些集合的方法包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的抗體或其功能片段,其中所述構(gòu)架區(qū)包括含如下以Fab形式的相對(duì)展示率的種系蛋白對(duì)的種系蛋白序列相比于對(duì)照至少0. 1 ;相比于對(duì)照至少0. 2 ;相比于對(duì)照至少0. 3 ;相比于對(duì)照至少0. 4 ;相比于對(duì)照至少0. 5 ;相比于對(duì)照至少0. 6 ;相比于對(duì)照至少0. 7 ;相比于對(duì)照至少0. 8 ;相比于對(duì)照至少0. 9 ;相比于對(duì)照至少1. 0 ;相比于對(duì)照至少1. 1 ;相比于對(duì)照至少1. 2 ;相比于對(duì)照至少1. 3 ;相比于對(duì)照至少1. 4 ;相比于對(duì)照至少1. 5 ;相比于對(duì)照至少1. 6 ;相比于對(duì)照至少1. 7 ;相比于對(duì)照至少1. 8 ;相比于對(duì)照至少1. 9 ;相比于對(duì)照至少2. 0 ;相比于對(duì)照至少2. 1 ;相比于對(duì)照至少2. 2 ;相比于對(duì)照至少2. 3 ;相比于對(duì)照至少2. 4 ;相比于對(duì)照至少2. 5 ;相比于對(duì)照至少2. 6 ;相比于對(duì)照至少2. 7 ;相比于對(duì)照至少2. 8 ;相比于對(duì)照至少2. 9 ;相比于對(duì)照至少3. 0 ;相比于對(duì)照至少3. 2 ;相比于對(duì)照至少3. 3 ;相比于對(duì)照至少3. 4 ;相比于對(duì)照至少3. 5 ;相比于對(duì)照至少3. 6 ;相比于對(duì)照至少3. 7 ;相比于對(duì)照至少3. 8 ;相比于對(duì)照至少4. 1 ;相比于對(duì)照至少4. 3 ;相比于對(duì)照至少4. 4 ;相比于對(duì)照至少4. 5 ;相比于對(duì)照至少4. 6 ;相比于對(duì)照至少4. 7 ;相比于對(duì)照至少5. 0 ;相比于對(duì)照至少5. 1 ;相比于對(duì)照至少5. 2 ;相比于對(duì)照至少5. 4 ;相比于對(duì)照至少5. 5 ;相比于對(duì)照至少5. 7 ;相比于對(duì)照至少5. 9 ;相比于對(duì)照至少6. 0 ;相比于對(duì)照至少6. 1 ;相比于對(duì)照至少6. 3 ;相比于對(duì)照至少6. 4 ;相比于對(duì)照至少6. 7 ;相比于對(duì)照至少6. 9 ;相比于對(duì)照至少7. 0 ;相比于對(duì)照至少7. 1 ;相比于對(duì)照至少7. 2 ;相比于對(duì)照至少7. 3 ;相比于對(duì)照至少7. 4 ;相比于對(duì)照至少8. 1 ;相比于對(duì)照至少8. 2 ;相比于對(duì)照至少8. 3 ;相比于對(duì)照至少8. 4 ;相比于對(duì)照至少8. 5 ;相比于對(duì)照至少8. 6 ;相比于對(duì)照至少8. 7 ;相比于對(duì)照至少8. 8 ;相比于對(duì)照至少8. 9 ;相比于對(duì)照至少9. 1 ;相比于對(duì)照至少9. 2 ;相比于對(duì)照至少9. 3 ;相比于對(duì)照至少9. 4 ;相比于對(duì)照至少
9.5 ;相比于對(duì)照至少9. 7 ;相比于對(duì)照至少9. 8 ;相比于對(duì)照至少10. 0 ;相比于對(duì)照至少
10.2 ;相比于對(duì)照至少10. 3 ;相比于對(duì)照至少10. 5 ;相比于對(duì)照至少10. 6 ;相比于對(duì)照至少10. 7 ;相比于對(duì)照至少10. 8 ;相比于對(duì)照至少11. 0 ;相比于對(duì)照至少11. 2 ;相比于對(duì)照至少11. 3 ;相比于對(duì)照至少11. 5 ;相比于對(duì)照至少11. 7 ;相比于對(duì)照至少11. 8 ;相比于對(duì)照至少12. 1 ;相比于對(duì)照至少12. 3 ;相比于對(duì)照至少12. 4 ;相比于對(duì)照至少12. 9 ;相比于對(duì)照至少13. 0 ;相比于對(duì)照至少13. 6 ;相比于對(duì)照至少14. 4 ;相比于對(duì)照至少14. 5 ;相比于對(duì)照至少16. 1 ;相比于對(duì)照至少16. 6 ;相比于對(duì)照至少16. 7 ;相比于對(duì)照至少17. 1 ;相比于對(duì)照至少19. 4 ;相比于對(duì)照至少27. 3 ;或相比于對(duì)照至少29. 0。在一些實(shí)施方案中,合成抗體或其功能片段的集合包括可變重鏈和可變輕鏈構(gòu)架區(qū),其中所述可變重鏈構(gòu)架區(qū)和可變輕鏈構(gòu)架區(qū)包括種系蛋白對(duì)的種系蛋白序列,其中所述種系蛋白對(duì)包括含如下值的以Fab形式的相對(duì)展示率采樣的前10% Fab中的值;采樣的前15% Fab中的值;采樣的前20% Fab中的值;采樣的前25% Fab中的值;采樣的前30% Fab中的值;采樣的前35% Fab中的值;采樣的前40% Fab中的值;采樣的前45% Fab中的值;采樣的前50% Fab中的值;采樣的前55% Fab中的值;采樣的前60% Fab中的值;采樣的前65% Fab中的值;采樣的前70% Fab中的值;采樣的前75% Fab中的值;采樣的前 80% Fab中的值;采樣的前85% Fab中的值;或采樣的前90% Fab中的值。在其他實(shí)施方案中,本發(fā)明的集合和/或生產(chǎn)這些集合的方法包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的抗體或其功能片段,其中所述構(gòu)架區(qū)包括種系蛋白對(duì)的種系蛋白序列, 所述種系蛋白對(duì)的種系蛋白序列包括如下值的以Fab形式的相對(duì)表達(dá)水平相比于Fab VH1-69VLA_V11-40AYA 至少 0. 1 ;相比于 Fab VH1-69VLA_V11_40AYA 至少 0. 2 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 3 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 4 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 5 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 6 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 7 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 8 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 9 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 1. 0 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 1. 1 ;相比于 Fab VH1-69VLA_V11_40AYA 至少 1. 2 ;或相比于 Fab VH1-69VLA_V11-40AYA 至少 1. 3。在其他實(shí)施方案中,本發(fā)明的集合和/或生產(chǎn)這些集合的方法包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的抗體或其功能片段,其中所述構(gòu)架區(qū)包括種系蛋白對(duì)的種系蛋白序列, 所述種系蛋白對(duì)的種系蛋白序列包括以Fab形式在70°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;或包括以Fab形式在80°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性。在其他實(shí)施方案中,本發(fā)明的集合和/或生產(chǎn)這些集合的方法包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的抗體或其功能片段,其中所述構(gòu)架區(qū)包括種系蛋白對(duì)的種系蛋白序列,所述種系蛋白對(duì)的種系蛋白序列包括如下值的以IgG形式的相對(duì)表達(dá)水平相比于 M0R03080至少0. 1 ;相比于M0R03080至少0. 2 ;相比于M0R03080至少0. 3 ;相比于M0R03080 至少0. 4 ;相比于M0R03080至少0. 5 ;相比于M0R03080至少0. 6 ;相比于M0R03080至少0. 7 ; 相比于M0R03080至少0. 8 ;相比于M0R03080至少0. 9 ;相比于M0R03080至少1. 0 ;相比于 M0R03080至少1. 1 ;相比于M0R03080至少1. 2 ;相比于M0R03080至少1. 3 ;相比于M0R03080 至少1. 4 ;相比于M0R03080至少1. 5 ;相比于M0R03080至少1. 6 ;相比于M0R03080至少1. 7 ; 相比于M0R03080至少1. 8 ;相比于M0R03080至少1. 9。在某些方面,本發(fā)明包括集合以及生產(chǎn)或使用含抗體或其功能片段的集合的方法,所述抗體或其功能片段包括含種系蛋白序列、基本上的種系蛋白序列或源自于種系蛋白序列的序列的一個(gè)或更多個(gè)互補(bǔ)決定區(qū)。在某些實(shí)施方案中,抗體或其功能片段包括含種系蛋白序列的CDRl和CDR2。在某些實(shí)施方案中,抗體或其功能片段包括含種系蛋白對(duì)的種系蛋白序列的⑶Rl和⑶R2。在一些方面,一個(gè)或更多個(gè)構(gòu)架區(qū)包括種系蛋白對(duì)的種系蛋白序列。如在一些方面,?1 4選自由朋、1^1和入2/3組成的組。如圖45A-47B所示,種系蛋白序列只包括 FR1-FR3。因此在某些方面,當(dāng)所述可變重鏈構(gòu)架區(qū)和可變輕鏈構(gòu)架區(qū)包括種系蛋白序列時(shí),F(xiàn)R1、FR2和/或FR3包括種系蛋白序列。在一些方面,一個(gè)或更多個(gè)構(gòu)架區(qū)包括種系蛋白序列,容許一個(gè)或更多個(gè)互補(bǔ)決定區(qū)的多樣化。在一些實(shí)施方案中,本發(fā)明包括集合以及生產(chǎn)和制備所述包括多樣化HCDR3區(qū)的合成抗體或其功能片段的集合的方法。在一些實(shí)施方案中,本發(fā)明包括集合以及生產(chǎn)和使用所述包括多樣化LCDR3區(qū)的合成抗體或其功能片段的集合的方法。本發(fā)明的另外一方面是集合可用于鑒定針對(duì)任何免疫原的抗體或其功能片段的能力。根據(jù)CDR長(zhǎng)度和在構(gòu)象或規(guī)范結(jié)構(gòu)上的多樣性,認(rèn)為產(chǎn)生具有包括以上功能特性的至少兩個(gè)可變重鏈和可變輕鏈種系蛋白對(duì)的集合將提供在該集合中的多樣性,尤其是在該集合的抗體的互補(bǔ)決定區(qū)中的多樣性。這容許本發(fā)明的集合可用于鑒定針對(duì)任何免疫原的抗體或其功能片段。本發(fā)明的一些實(shí)施方案包括如下集合所述集合包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的抗體或其功能片段,其中所述構(gòu)架區(qū)包括具有如下特性的種系蛋白對(duì)的種系蛋白序列i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1_69VLA_ V11-40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在 37°C持續(xù)十四天的在牛血清中的穩(wěn)定性,其中所述集合包括含如下數(shù)目的不同的種系蛋白對(duì)的抗體或其功能片段至少兩個(gè)不同的種系蛋白對(duì);至少三個(gè)不同的種系蛋白對(duì);至少四個(gè)不同的種系蛋白對(duì);至少五個(gè)不同的種系蛋白對(duì);至少六個(gè)不同的種系蛋白對(duì);至少七個(gè)不同的種系蛋白對(duì);至少八個(gè)不同的種系蛋白對(duì);至少九個(gè)不同的種系蛋白對(duì);至少十個(gè)不同的種系蛋白對(duì);至少十一個(gè)不同的種系蛋白對(duì);至少十二個(gè)不同的種系蛋白對(duì); 至少十三個(gè)不同的種系蛋白對(duì);至少十四個(gè)不同的種系蛋白對(duì);至少十五個(gè)不同的種系蛋白對(duì);至少十六個(gè)不同的種系蛋白對(duì);至少十七個(gè)不同的種系蛋白對(duì);至少十八個(gè)不同的種系蛋白對(duì);至少十九個(gè)不同的種系蛋白對(duì);至少二十個(gè)不同的種系蛋白對(duì);至少21個(gè)不同的種系蛋白對(duì);至少22個(gè)不同的種系蛋白對(duì);至少23個(gè)不同的種系蛋白對(duì);至少24個(gè)不同的種系蛋白對(duì);至少25個(gè)不同的種系蛋白對(duì);至少26個(gè)不同的種系蛋白對(duì);至少27個(gè)不同的種系蛋白對(duì);至少28種不同的可變重鏈種系蛋白;至少29個(gè)不同的種系蛋白對(duì)序列;至少30個(gè)不同的種系蛋白對(duì);至少31個(gè)不同的種系蛋白對(duì);至少32個(gè)不同的種系蛋白對(duì);至少33個(gè)不同的種系蛋白對(duì);至少34個(gè)不同的種系蛋白對(duì);至少35個(gè)不同的種系蛋白對(duì);至少36個(gè)不同的種系蛋白對(duì);至少37個(gè)不同的種系蛋白對(duì);至少38個(gè)不同的種系蛋白對(duì);至少39個(gè)不同的種系蛋白對(duì);至少40個(gè)不同的種系蛋白對(duì);至少41個(gè)不同的種系蛋白對(duì);至少42個(gè)不同的種系蛋白對(duì);至少43個(gè)不同的種系蛋白對(duì);至少44種不同的可變重鏈種系蛋白;至少45個(gè)不同的種系蛋白對(duì)序列;至少46個(gè)不同的種系蛋白對(duì);至少47個(gè)不同的種系蛋白對(duì);至少48個(gè)不同的種系蛋白對(duì);至少49個(gè)不同的種系蛋白對(duì)或至少50個(gè)不同的種系蛋白對(duì)。包含種系基因序列的抗體或其功能片段另外,認(rèn)為利用種系蛋白序列將降低抗體在施用至患者時(shí)的免疫原性風(fēng)險(xiǎn)。因此, 本發(fā)明的方面包括集合以及生產(chǎn)和使用含可變重鏈和可變輕鏈構(gòu)架區(qū)的合成抗體或其功能片段的所述集合的方法,其中所述構(gòu)架區(qū)包括種系蛋白序列。在一些實(shí)施方案中,抗體或其功能片段的可變重鏈和可變輕鏈構(gòu)架區(qū)包括基本上的種系序列。在一些實(shí)施方案中,抗體或其功能片段的可變重鏈和可變輕鏈構(gòu)架區(qū)源自于種系序列。在一些實(shí)施方案中,所述抗體或其功能片段包括含種系蛋白序列、基本上的種系序列或源自于種系蛋白序列的FR1、FR2、FR3和FR4區(qū)。在某些實(shí)施方案中,所述抗體或其功能片段包括含代表性種系蛋白對(duì)的種系蛋白序列的FR1、FR2、FR3。在一些實(shí)施方案中,使用的FR4區(qū)是可變重鏈的JH4,可變?chǔ)瘦p鏈的J κ 1和可變?chǔ)溯p鏈的J λ 2/3。又因?yàn)槔梅N系蛋白序列將降低抗體在患者中施用時(shí)的免疫原性風(fēng)險(xiǎn),所以本發(fā)明的某些方面包括集合以及生產(chǎn)或使用包含一個(gè)或更多個(gè)互補(bǔ)決定區(qū)的抗體或其功能片段的集合的方法,所述一個(gè)或更多個(gè)互補(bǔ)決定區(qū)包括種系蛋白序列、基本上的種系序列或源自于種系蛋白序列。在某些實(shí)施方案中,抗體或其功能片段包括含種系蛋白序列的CDRl 和CDR2。在某些實(shí)施方案中,抗體或其功能片段包括含種系蛋白對(duì)的種系蛋白序列的CDRl 和 CDR2。在一些方面,一個(gè)或更多個(gè)構(gòu)架區(qū)包括種系蛋白序列,容許一個(gè)或更多個(gè)互補(bǔ)決定區(qū)的多樣化。在一些實(shí)施方案中,本發(fā)明包括集合以及生產(chǎn)和制備所述包括多樣化HCDR3 區(qū)的合成抗體或其功能片段的集合的方法。在一些實(shí)施方案中,本發(fā)明包括集合以及生產(chǎn)和使用所述包括多樣化LCDR3區(qū)的合成抗體或其功能片段的集合的方法。CDR可通過(guò)本領(lǐng)域公知的方法設(shè)計(jì),包括那些公開(kāi)在Knappik等人2000 ;WO 97/08320 ;W02008053275 ; W02009036379 ;W02007056441 ;W02009114815中的方法,這些文獻(xiàn)全部通過(guò)引用整體并入。另外,為了產(chǎn)生包含具有低免疫原性風(fēng)險(xiǎn)的抗體或其功能片段的集合,在某些方面,本發(fā)明的集合以及生產(chǎn)和使用這些集合的方法包括含人序列的抗體或其功能片段。在一些方面,本發(fā)明的集合包括至少I(mǎi)XlO4;至少I(mǎi)XlO5;至少I(mǎi)XlO6;至少 IX IO7;至少I(mǎi)X IO8;至少I(mǎi)X IO9;至少I(mǎi)X IOltl;或至少I(mǎi)X IO11種編碼抗體或其功能片段的核酸序列或者抗體或其功能片段。在一些方面,集合的抗體或其功能片段是合成的。在一些方面,集合包括編碼抗體或其功能片段的核酸。本發(fā)明另外的實(shí)施方案在一些方面,本發(fā)明包括含可變重鏈和可變輕鏈構(gòu)架區(qū)的合成抗體或其功能片段的集合,其中所述可變重鏈構(gòu)架區(qū)和可變輕鏈構(gòu)架區(qū)包括種系蛋白對(duì)的種系蛋白序列,其中所述種系蛋白對(duì)包含如下特性i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1_69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;禾口vi)以IgG形式在37°C持續(xù)十四天的在血清中的穩(wěn)定性;其中所述抗體或其功能片段的集合包括至少兩個(gè)不同的種系蛋白對(duì)的種系蛋白序列,且其中所述種系蛋白對(duì)由種系基因?qū)幋a。在一些實(shí)施方案中,本發(fā)明包括合成抗體或其功能片段的集合,其中所述可變重鏈和可變輕鏈構(gòu)架區(qū)基本上由包括如下特性的種系蛋白對(duì)的種系蛋白序列組成i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1_69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達(dá)水平;
46
iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;禾口vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些實(shí)施方案中,本發(fā)明包括合成抗體或其功能片段的集合,其中所述可變重鏈和可變輕鏈構(gòu)架區(qū)由包括如下特性的種系蛋白對(duì)的種系蛋白序列組成i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1_69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。在一些實(shí)施方案中,所述種系基因?qū)σ灾辽?.05%的濃度存在于人免疫組庫(kù)中。 在一些實(shí)施方案中,所述種系基因?qū)σ灾辽?. 23%的濃度存在于人免疫組庫(kù)中。在一些實(shí)施方案中,所述種系基因?qū)σ灾辽?. 51 %的濃度存在于人免疫組庫(kù)中。在一些實(shí)施方案中, 所述種系基因?qū)σ灾辽?.07%的濃度存在于幼稚的人免疫組庫(kù)中。在一些實(shí)施方案中,所述種系基因?qū)σ灾辽?.52%的濃度存在于幼稚的人免疫組庫(kù)中。在一些實(shí)施方案中,所述種系基因?qū)σ灾辽?.88%的濃度存在于幼稚的人免疫組庫(kù)中。在一些實(shí)施方案中,所述抗體或其功能片段包括人序列。在一些實(shí)施方案中,所述抗體或其功能片段的集合包括至少十七個(gè)不同的種系蛋白對(duì)的種系蛋白序列。在一些實(shí)施方案中,所述抗體或其功能片段包括含種系蛋白序列的一個(gè)或更多個(gè)互補(bǔ)決定區(qū)。在一些實(shí)施方案中,所述抗體或其功能片段包括含種系蛋白序列的FR1、CDR1、 FR2、CDR2和FR3區(qū)。在一些實(shí)施方案中,所述抗體或其功能片段包括選自由以下組成的組的FR4區(qū)JH4、Jk 1和JX 2/3。在一些實(shí)施方案中,所述抗體或其功能片段包括多樣化的 HCDR3區(qū)。在一些實(shí)施方案中,所述抗體或其功能片段包括多樣化的IXDR3區(qū)。在一些實(shí)施方案中,集合包括IXlO4種抗體或其功能片段。在一些實(shí)施方案中, 所述種系蛋白對(duì)包括含在采樣的前60% Fab中的值的以Fab形式的相對(duì)展示率。在一些實(shí)施方案中,所述種系蛋白對(duì)包括與Fab VH1-69VLA_V11-40AYA相比至少0. 6的以Fab形式的表達(dá)水平。在一些實(shí)施方案中,所述種系蛋白對(duì)包括以Fab形式在70°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性。在一些實(shí)施方案中,所述種系蛋白對(duì)包括與M0R03080相比至少 0.6的以IgG形式的表達(dá)水平。在一些實(shí)施方案中,可變重鏈和可變輕鏈構(gòu)架區(qū)包括選自由以下組成的組的種系蛋白對(duì)的種系蛋白序列IGHV3-23/IGKVl-5 ; IGHV3-23/IGKV3-20 ;IGHV4-39/ IGKV3-15 ; IGHV3-23/IGKV3-15 ; IGHV4-39/IGKV1-39/1D-39 ; IGHV1-18/IGKV3-20 ; IGHV3-30/IGKV3-20 ; IGHV4-39/IGKV1-5 ; IGHV1-69/IGKV1-39/1D-39 ;IGHV5-51/ IGLV1-40 ; IGHV4-39/IGKV3-20 ; IGHV3-23/IGLV 2-14 ;IGHV4-39/IGLV 3-21 ;IGHV3-23/ IGKV1-39/1D-39 ; IGHV3-30/IGKV1-39/1D-39 ;IGHV1-69/IGKV3-20 ; IGHV3-48/IGKV3-20 ; IGHV1-2/IGKV3-20 ;IGHV3-30/IGKV4-1 ;IGHV5-51/IGLV 2-14 ;IGHV5-51/IGKV3-20 ; IGHV3-7/IGKV1-39/1D-39 ;IGHV3-7/IGKV1-5 ;IGHV3-15/IGKV3-20 ;IGHV4-39/IGLV2-14 ; ighv3-23/igkv3-11 ;ighv3-30/igkv1-5 ;ighv3-30/igkv3-15 ;ighv3-21/igkv1-5 ; ighv3-21/igkv3-15 ; ighv3-30/iglv 1-51 ;ighv3-21/iglv 1-51 ;和 ighv1-69/igkv3-11。在一些實(shí)施方案中,所述抗體的所述功能片段選自由Fab、F (ab' ) 2、Fab,、Fv和 scFv組成的組。在一些方面,本發(fā)明包括編碼公開(kāi)的抗體集合的核酸的集合。在一些方面,本發(fā)明包括含編碼公開(kāi)的抗體集合的核酸的載體。在一些方面,本發(fā)明包括含編碼公開(kāi)的抗體集合的核酸的重組宿主細(xì)胞。在一些實(shí)施方案中,重組宿主細(xì)胞是原核的或真核的。在一些實(shí)施方案中,重組宿主細(xì)胞是大腸桿菌或哺乳動(dòng)物細(xì)胞。在一些方面,本發(fā)明包括含可變重鏈構(gòu)架區(qū)和可變輕鏈構(gòu)架區(qū)的合成抗體或其功能片段的集合,其中所述構(gòu)架區(qū)包括種系蛋白序列,其中所述種系蛋白序列包含如下特性i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾;ii)在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii) 一個(gè)或更少的未成對(duì)半胱氨酸;iv) 一個(gè)或更少的潛在t細(xì)胞表位;ν)中等或低的聚集傾向;和vi)至少7.5的等電點(diǎn);且其中所述抗體或其功能片段的集合包括至少兩種不同的可變重鏈種系蛋白序列,其中所述種系蛋白序列由種系基因序列編碼。在一些實(shí)施方案中,所述可變重鏈或可變輕鏈種系基因序列以至少0. 5%的濃度存在于人免疫組庫(kù)中。在一些實(shí)施方案中,所述抗體或其功能片段的集合包括至少五種不同的可變重鏈種系蛋白序列。在一些實(shí)施方案中,所述抗體或其功能片段包括人序列。在一些實(shí)施方案中,所述可變重鏈或可變輕鏈種系基因序列以至少5. 0%的濃度存在于人免疫組庫(kù)中。在一些實(shí)施方案中,所述抗體或其功能片段包括含種系蛋白序列的一個(gè)或更多個(gè)互補(bǔ)決定區(qū)。在一些實(shí)施方案中,所述抗體或其功能片段包括含種系蛋白序列的fr1、cdr1、 fr2、cdr2和fr3。在一些實(shí)施方案中,所述抗體或其功能片段包括選自由以下組成的組的 fr4區(qū)jh4、jk 1和jx 2/3。在一些實(shí)施方案中,所述抗體或其功能片段還包括多樣化的 hcdr3區(qū)。在一些實(shí)施方案中,所述抗體或其功能片段還包括多樣化的ixdr3區(qū)。在一些實(shí)施方案中,集合包括1 x io4種抗體或其功能片段。在一些實(shí)施方案中,所述可變重鏈種系蛋白序列選自由以下組成的組ighv3_23 ; ighv3-30 ; ighv4-39 ; ighv4-34 ; ighv4-59 ;ighv1-69 ; ighv5-51 ; ighv3-7 ;ighv1-18 ; ighv3-48 ;ighv3-15 ; ighv3-21 ; ighv1-2 ; ighv3-33 ; ighv4-31 ; ighv3-53 ; ighv3-11 ; ighv3-9 ; ighv4-4 ; ighv1-46 ; ighv3-74 ; ighv1-24 ; ighv4-61 ; ighv1-8 ; ighv1-3 ; ighv3-49 ; ighv3-43 ; ighv4-28 ; ighv3-64 ;和 ighv7-81。在一些實(shí)施方案中,所述可變?chǔ)瘦p鏈種系蛋白序列選自由以下組成的組 igkv3-20 ; igkv1-39/1d-39 ; igkv1-5 ; igkv3-15 ; igkv4-1 ; igkv3-11 ; igkv2-28/2d-28 ; igkv1-33/1d-33 ;igkv2-30 ; igkv1-9 ;igkv1-17 ; igkv1-27 ; igkv1-8 ;igkv1-16 ; igkv1-6 ; igkv1-12 ; igkv2d-29 ;igkv1-13 ; igkv1d-8 ;和 igkv2-24。
在一些實(shí)施方案中,所述可變?chǔ)溯p鏈種系蛋白序列選自由以下組成的組 IGLV2-14 ; IGLV1-40 ;IGLV1-44 ;IGLV卜51 ; IGLV2-23 ;IGLV3-21 ;IGLV1-47 ;IGLV3-1 ; IGLV2-11 ; IGLV2-8 ; IGLV6-57 ; IGLV3-25 ; IGLV7-46 ;IGLV1-36 ; IGLV7-43 ; IGLV9-49 ; IGLV4-69 ; IGLV2-18 ; IGLV3-10 ;和 IGLV3-27。在一些方面,本發(fā)明包括生產(chǎn)公開(kāi)的合成抗體或其功能片段的集合的方法。在一些實(shí)施方案中,生產(chǎn)步驟還包括產(chǎn)生含可變重鏈和可變輕鏈構(gòu)架區(qū)的抗體或其功能片段的
皇A 朱η j其中所述可變重鏈構(gòu)架區(qū)和可變輕鏈構(gòu)架區(qū)包含種系蛋白對(duì)的種系蛋白序列,其中所述種系蛋白對(duì)包含如下特性i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與Fab VH1_69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性;且其中所述抗體或其功能片段的集合包括至少兩個(gè)不同的種系蛋白對(duì)。在一些實(shí)施方案中,生產(chǎn)步驟還包括如下步驟a)獲得包括在人免疫組庫(kù)中存在的可變重鏈和可變輕鏈種系基因?qū)Φ臄?shù)據(jù);b)鑒定包含如下特性的可變重鏈和可變輕鏈種系蛋白對(duì)i)以Fab形式的相對(duì)展示率包括在采樣的前75% Fab中的值;ii)與 Fab pMxll_FH VH1-69VLA_V11_40AYA相比至少 0. 4 的以 Fab 形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)與M0R3080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性;和c)產(chǎn)生包含在步驟b)中鑒定的種系蛋白對(duì)的可變重鏈種系蛋白序列和可變輕鏈種系蛋白序列的抗體或其功能片段的集合。在一些實(shí)施方案中,步驟b)還包括如下步驟ba)鑒定以至少0.05%的濃度存在于人免疫組庫(kù)中的可變重鏈和可變輕鏈種系基因?qū)?;bb)產(chǎn)生包含在步驟ba)中鑒定的種系蛋白對(duì)的抗體或其功能片段;和be)評(píng)估所述種系蛋白對(duì)的如下特性i)以Fab形式的相對(duì)展示率;ii)以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性;ν)以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。
49
在一些實(shí)施方案中,步驟a)還包括如下步驟aa)從樣品中分離人B細(xì)胞;ab)從所述B細(xì)胞產(chǎn)生cDNA ;ac) PCR擴(kuò)增來(lái)自B細(xì)胞的cDNA ;ad)對(duì)所述PCR產(chǎn)物測(cè)序;ae)鑒定每種PCR產(chǎn)物的種系基因。在一些實(shí)施方案中,產(chǎn)生集合的步驟還包括如下步驟ca)合成編碼所述抗體或其功能片段的核酸;cb)將所述核酸克隆到載體中;cc)表達(dá)所述抗體或其功能片段。在一些實(shí)施方案中,所述種系基因?qū)σ灾辽?.05%的濃度存在于人免疫組庫(kù)中。 在一些實(shí)施方案中,所述種系基因?qū)σ灾辽?. 23%的濃度存在于人免疫組庫(kù)中。在一些實(shí)施方案中,所述種系基因?qū)σ灾辽?. 51 %的濃度存在于人免疫組庫(kù)中。在一些實(shí)施方案中, 所述種系基因?qū)σ灾辽?.07%的濃度存在于幼稚的人免疫組庫(kù)中。在一些實(shí)施方案中,所述種系基因?qū)σ灾辽?.52%的濃度存在于幼稚的人免疫組庫(kù)中。在一些實(shí)施方案中,所述種系基因?qū)σ灾辽?.88%的濃度存在于幼稚的人免疫組庫(kù)中。在一些實(shí)施方案中,所述抗體或其功能片段包括人序列。在一些實(shí)施方案中,所述抗體或其功能片段包括至少十七個(gè)不同的種系蛋白對(duì)的種系蛋白序列。在一些實(shí)施方案中,所述抗體或其功能片段包括含種系蛋白序列的一個(gè)或更多個(gè)互補(bǔ)決定區(qū)。在一些實(shí)施方案中,所述抗體或其功能片段包括含種系蛋白序列的FR1、CDRU FR2、CDR2和FR3。在一些實(shí)施方案中,所述抗體或其功能片段包括選自由以下組成的組的FR4區(qū)JH4、JK 1和JX2/3。在一些實(shí)施方案中,所述抗體或其功能片段包括多樣化的 HCDR3區(qū)。在一些實(shí)施方案中,所述抗體或其功能片段包括多樣化的IXDR3區(qū)。在一些實(shí)施方案中,集合包括1 X IO4種抗體或其功能片段。在一些實(shí)施方案中,所述種系蛋白對(duì)包括含在采樣的前60% Fab中的值的以Fab 形式的相對(duì)展示。在一些實(shí)施方案中,所述種系蛋白對(duì)包括與Fab VH1-69VLA_V11-40AYA相比至少0. 6的以Fab形式的表達(dá)水平。在一些實(shí)施方案中,所述種系蛋白對(duì)包括以Fab形式在70°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性。在一些實(shí)施方案中,所述種系蛋白對(duì)包括與M0R03080相比至少0. 6的以IgG形式的表達(dá)水平。在一些實(shí)施方案中,可變重鏈和可變輕鏈構(gòu)架區(qū)包括選自由以下組成的組的種系蛋白對(duì)的種系蛋白序列IGHV3-23/IGKVl-5 ;IGHV3-23/IGKV3-20 ;IGHV4-39/IGKV3-15 ; IGHV3-23/IGKV3-15 ; IGHV4-59/IGKV1-39/1D-39 ;IGHV4-39/IGKV1-39/1D-39 ;IGHV4-59/ IGKV3-20 ;IGHV1-18/IGKV3-20 ;IGHV3-30/IGKV3-20 ;IGHV4-39/IGKV1-5 ;IGHV1-69/ IGKV1-39/1D-39 ; IGHV5-51/IGLV1-40 ; IGHV3-23/IGKV4-1 ; IGHV4-39/IGKV3-20 ; IGHV3-23/IGLV 2-14 ; IGHV4-39/IGLV 3-21 ; IGHV3-23/IGKV1-39/1D-39 ; IGHV3-30/ IGKV1-39/1D-39 ; IGHV3-30/IGKV3-11 ; IGHV1-69/IGKV3-20 ; IGHV3-48/IGKV3-20 ; IGHV1-2/IGKV3-20 ;IGHV3-30/IGKV4-1 ;IGHV5-51/IGLV 2-14 ;IGHV4-59/IGKV4-1 ; IGHV5-51/IGKV3-20 ; IGHV3-7/IGKV1-39/1D-39 ; IGHV3-7/IGKV1-5 ;IGHV3-15/IGKV3-20 ; IGHV4-39/IGLV 2-14 ;IGHV4-39/IGLV 2-8 ;IGHV3-23/IGKV3-11;IGHV3-30/IGKV1-5 ;IGHV3-30/IGKV3-15 ;IGHV3-21/IGKV1-5 ;IGHV3-21/IGKV3-15 ;IGHV3-30/IGLV1-51 ; IGHV3-21/IGLV 1-51 ;IGHV3-53/IGLV 1-44 ;IGHV4-59/IGKV3-15 ;IGHV5-51/IGKV4-1 ; IGHV1-69/IGKV4-1 ;和 IGHV1-69/IGKV3-11。在一些方面,所述抗體的所述功能片段選自由Fab、F(ab' ) 2、Fab,、Fv和scFv組成的組。在一些方面,本發(fā)明包括編碼含C端限制酶切位點(diǎn)的信號(hào)序列或前導(dǎo)序列的分離的核酸。在一些實(shí)施方案中,限制酶切位點(diǎn)是NheI。在一些實(shí)施方案中,信號(hào)序列或前導(dǎo)序列包括PhoA或人重鏈前導(dǎo)序列。在一些實(shí)施方案中,限制酶切位點(diǎn)是NdeI。在一些實(shí)施方案中,信號(hào)序列包括ompA或人κ前導(dǎo)序列。在一些方面,本發(fā)明包括含如下核酸的載體所述核酸編碼含C端限制酶切位點(diǎn)的信號(hào)序列或前導(dǎo)序列。在一些方面,本發(fā)明包括含所述載體的宿主細(xì)胞。在一些實(shí)施方案中,宿主細(xì)胞是原核的或真核的。在一些實(shí)施方案中,宿主細(xì)胞是大腸桿菌。在一些實(shí)施方案中,宿主細(xì)胞是哺乳動(dòng)物細(xì)胞。在一些方面,本發(fā)明包括含F(xiàn)Rl、OTRl、FR2、raR2和FR3的分離的抗體或其功能片段,所述FRl、OTRl、FR2、raR2和FR3包含種系蛋白對(duì)的種系蛋白序列,其中所述種系蛋白對(duì)選自由以下組成的組IGHV3-23/IGKV1-5 ; IGHV3-23/IGKV3-20 ; IGHV4-39/IGKV3-15 ; IGHV3-23/ IGKV3-15 ; IGHV4-39/IGKV1-39/1D-39 ; IGHV1-18/IGKV3-20 ; IGHV3-30/IGKV3-20 ; IGHV4-39/IGKV1-5 ;IGHV1-69/IGKV1-39/1D-39 ;IGHV5-51/IGLV 1-40 ;IGHV4-39/ IGKV3-20 ; IGHV3-23/IGLV 2-14 ; IGHV4-39/IGLV 3-21 ; IGHV3-23/IGKV1-39/1D-39 ; IGHV3-30/IGKV1-39/1D-39 ; IGHV1-69/IGKV3-20 ; IGHV3-48/IGKV3-20 ; IGHV1-2/ IGKV3-20 ; IGHV3-30/IGKV4-1 ;IGHV5-51/IGLV 2-14 ;IGHV5-51/IGKV3-20 ;IGHV3-7/ IGKV1-39/1D-39 ;IGHV3-7/IGKV1-5 ;IGHV3-15/IGKV3-20 ;IGHV4-39/IGLV2-14 ;IGHV3-23/ IGKV3-11 ;IGHV3-30/IGKV1-5 ;IGHV3-30/IGKV3-15 ;IGHV3-21/IGKV1-5 ;IGHV3-21/ IGKV3-15 ; IGHV3-30/IGLV 1-51 ;IGHV3-21/IGLV 1-51 ;和 IGHV1-69/I。一方面,本公開(kāi)內(nèi)容描述了包括含可變重鏈和輕鏈構(gòu)架區(qū)(具體是FRl)的抗體的集合,所述可變重鏈和輕鏈構(gòu)架區(qū)包含種系序列。預(yù)期具有種系構(gòu)架區(qū)將降低抗體在施用至患者時(shí)的免疫原性風(fēng)險(xiǎn)。然而,必須使用限制酶切位點(diǎn)以使得能將編碼抗體集合的核酸標(biāo)準(zhǔn)地克隆到展示載體和/或表達(dá)載體中,以便可針對(duì)免疫原篩選抗體。過(guò)去,用于克隆的限制酶切位點(diǎn)通常位于構(gòu)架區(qū)內(nèi),從而修飾核酸序列遠(yuǎn)離種系。為了確保本公開(kāi)內(nèi)容的每種抗體的至少構(gòu)架I(FRl)區(qū)保持種系序列,在FRl內(nèi)應(yīng)該沒(méi)有任何非天然存在的限制酶切位點(diǎn)。因此,本公開(kāi)內(nèi)容的一個(gè)方面是在原核信號(hào)序列和人前導(dǎo)序列的C端內(nèi)具體是在三個(gè)C端殘基內(nèi)摻入限制酶切位點(diǎn)。另外,包含限制酶切位點(diǎn)的信號(hào)序列和前導(dǎo)序列必須是有功能的并且容許抗體或其片段在原核和哺乳動(dòng)物表達(dá)系統(tǒng)中均有良好的展示和表達(dá)水平。在一些方面,本發(fā)明包括編碼含C端限制酶切位點(diǎn)的信號(hào)序列或前導(dǎo)序列的分離的核酸。在一些實(shí)施方案中,限制酶切位點(diǎn)是NheI或NdeI。在一些實(shí)施方案中,信號(hào)序列或前導(dǎo)序列包括PhoA或人重鏈前導(dǎo)序列。在一些實(shí)施方案中,信號(hào)序列或前導(dǎo)序列包括 ompA或人κ前導(dǎo)序列。在一些方面,本發(fā)明包括含如下分離的核酸的載體所述分離的核酸編碼含C端限制酶切位點(diǎn)的信號(hào)序列或前導(dǎo)序列。在一些方面,本發(fā)明包括含編碼具有 C端限制酶切位點(diǎn)的信號(hào)序列或前導(dǎo)序列的分離的核酸的宿主細(xì)胞或含編碼具有C端限制酶切位點(diǎn)的信號(hào)序列或前導(dǎo)序列的分離的核酸的載體。在一些實(shí)施方案中,相應(yīng)的宿主細(xì)胞是原核的,例如大腸桿菌,或是真核的,例如哺乳動(dòng)物細(xì)胞。本公開(kāi)內(nèi)容第一次公開(kāi)如下概念在幼稚的人免疫組庫(kù)中最普遍的VH和VL類對(duì)可能具有優(yōu)選的特征,如更大的穩(wěn)定性和更低的免疫原性。本公開(kāi)內(nèi)容還第一次將這種概念引入集合設(shè)計(jì)中并且利用全基因合成來(lái)產(chǎn)生這些集合。本公開(kāi)內(nèi)容使得鑒定幼稚的和經(jīng)歷抗原的人免疫組庫(kù)中的VH和VL類對(duì)、確定最普遍的VH和VL類對(duì)并然后產(chǎn)生包含這些 VH和VL類對(duì)的集合的方法成為可能。更具體而言,本公開(kāi)內(nèi)容的集合包括具有高度多樣化的CDR的最普遍的和/或最優(yōu)選的VH和VL類配對(duì)。這種策略提高了集合包括穩(wěn)定的、具有低免疫原性和對(duì)特定抗原的高親和力的針對(duì)任何免疫原的抗體或其片段的概率。該結(jié)果極大地提高了集合包括可用于治療或診斷目的的針對(duì)任何免疫原的高度有效的抗體或其片段的概率。因此,可對(duì)從人宿主的幼稚B細(xì)胞獲得的編碼抗體或其片段的核酸序列(或其選定部分)進(jìn)行測(cè)序。從這些序列數(shù)據(jù),可鑒定在免疫組庫(kù)中代表性的種系家族VH/VL鏈類配對(duì)。基于某些指標(biāo)如普遍性(prevalence)和/或有利的生物物理特性,選擇重鏈和輕鏈類對(duì)摻入集合中。然后可通過(guò)基因合成來(lái)合成集合。在一些實(shí)施方案中,合成的集合包括基本上的種系VH和VL構(gòu)架區(qū),其中CDR是多樣化的,或者VH和/或VL僅一個(gè)CDR是多樣化的。使用從人宿主的幼稚B細(xì)胞獲得的DNA序列作為“模板”,本公開(kāi)內(nèi)容使得鑒定最普遍的VH和VL對(duì)的方法成為可能。一旦闡明VH和VL類對(duì)的相對(duì)豐度,就可以產(chǎn)生包含最普遍的和/或最優(yōu)選的VH和VL類對(duì)的抗體或其片段的高度多樣的集合。利用這種信息, 技術(shù)人員能夠產(chǎn)生高度的多樣性而不犧牲可歸因于最普遍的和/或最優(yōu)選的VH和VL類對(duì)組合的關(guān)鍵益處。在本公開(kāi)內(nèi)容之前,沒(méi)有人闡釋最普遍的和/或最優(yōu)選的VH和VL類對(duì)或嘗試將該知識(shí)應(yīng)用到文庫(kù)產(chǎn)生技術(shù)中。因此,這種方法提供了編碼代表幼稚的人免疫系統(tǒng)的抗體或其片段的核酸的全面的集合。利用本文公開(kāi)的集合設(shè)計(jì)和展示方法,可產(chǎn)生大多樣性的集合,因?yàn)橐恍?shí)施方案包括至少I(mǎi)X101°種成員的集合。在一些方面,本公開(kāi)內(nèi)容使得包含公開(kāi)的核酸集合的載體和宿主細(xì)胞成為可能。在一些方面,本公開(kāi)內(nèi)容使得生產(chǎn)這些集合的方法成為可能。在一些實(shí)施方案中,在單獨(dú)步驟中獲得代表人免疫組庫(kù)的幼稚DNA序列,并將其儲(chǔ)存在數(shù)據(jù)庫(kù)中;因此集合設(shè)計(jì)可經(jīng)由計(jì)算機(jī)模擬被容易地改變、優(yōu)化和定制,容許通常可在合成文庫(kù)中實(shí)現(xiàn)的定制水平。在一些方面,本公開(kāi)內(nèi)容使得利用所公開(kāi)的集合鑒定抗體或其片段的方法成為可能。在一些方面,本發(fā)明涉及編碼抗體或其片段的集合或文庫(kù),所述抗體或其片段包含由免疫組庫(kù)中豐富和/或優(yōu)選的VH和VL種系家族和/或基因編碼的種系蛋白序列。在一些實(shí)施方案中,編碼抗體或其片段的核酸是種系、基本上的種系或其密碼子優(yōu)化的變體。這些集合或文庫(kù)可包括具有有利的生物物理特性的VH和VL種系家族和/或基因,所述有利的生物物理特性包括在噬菌體上的高度展示;以Fab形式在大腸桿菌中的高表達(dá);以IgG 形式在哺乳動(dòng)物細(xì)胞中的高表達(dá);高熱穩(wěn)定性;血清穩(wěn)定性;低聚集傾向(即,高溶解性); 和低免疫原性風(fēng)險(xiǎn)。在一些實(shí)施方案中,集合或文庫(kù)可包括存在于幼稚的人免疫組庫(kù)中的 VH和VL種系家族和/或基因。相關(guān)的實(shí)施方案包括制備和使用這些集合的方法。在一些方面,本發(fā)明涉及編碼抗體或其片段的集合或文庫(kù),所述抗體或其片段包含由免疫組庫(kù)中豐富和/或優(yōu)選的VH和VL種系家族和/或基因以及免疫組庫(kù)中豐富和/ 或優(yōu)選的VH/VL類對(duì)編碼的種系蛋白序列。在一些實(shí)施方案中,編碼抗體或其片段的核酸是種系、基本上的種系或其密碼子優(yōu)化的變體。這些集合或文庫(kù)可包括由具有有利的生物物理特性的VH和VL種系家族和/或基因和/或VH/VL類對(duì)編碼的種系蛋白序列,所述有利的生物物理特性包括在噬菌體上的高度展示;以Fab形式在大腸桿菌中的高表達(dá);以IgG 形式在哺乳動(dòng)物細(xì)胞中的高表達(dá);高熱穩(wěn)定性;血清穩(wěn)定性;低聚集傾向(即,高溶解性); 和低免疫原性風(fēng)險(xiǎn)。在一些實(shí)施方案中,集合或文庫(kù)可包括由存在于幼稚的人免疫組庫(kù)的 VH和VL種系家族和/或基因和/或VH/VL類對(duì)編碼的種系蛋白序列。相關(guān)的實(shí)施方案包括制備和使用這些集合的方法。因此,本發(fā)明包括編碼基本上代表免疫組庫(kù)的抗體或其片段的核酸的集合,其中每種抗體或其片段包括VH/VL類對(duì),其中基本上代表免疫組庫(kù)是使得該集合中存在的每個(gè) VH/VL類對(duì)為在免疫組庫(kù)中以至少0. 05%、至少1 %或至少2%的VH/VL類對(duì)的濃度存在的 VH/VL類對(duì)。免疫組庫(kù)可以是個(gè)體或群體,并且可以是幼稚的。這種免疫組庫(kù)可被測(cè)定為如下VH/VL類對(duì)的免疫組庫(kù),例如在來(lái)自個(gè)體的至少I(mǎi)X IO5個(gè)B細(xì)胞中的VH/VL類對(duì);在來(lái)自多個(gè)個(gè)體的群體的至少1 X IO5個(gè)B細(xì)胞中的VH/VL類對(duì);或存在于至少1 X IO5種抗體中的VH/VL類對(duì)。免疫組庫(kù)可以是幼稚B細(xì)胞或經(jīng)歷抗原的B細(xì)胞的免疫組庫(kù)。個(gè)體或群體可以是人。免疫組庫(kù)可通過(guò)分析公開(kāi)可用的數(shù)據(jù)庫(kù)和/或文獻(xiàn)來(lái)確定。在一些實(shí)施方案中,編碼抗體或其片段的核酸是合成的,如通過(guò)全基因合成而產(chǎn)生。在相關(guān)的實(shí)施方案中,核酸是種系序列;基本上的種系序列;或是種系或基本上的種系序列的密碼子優(yōu)化的變體。在一些實(shí)施方案中,CDR中至少一個(gè)是高度多樣化的。在一些實(shí)施方案中,本公開(kāi)內(nèi)容的集合包括抗體或其片段,其中VH和VL 二者的 FRl、FR2和FR3包括具有優(yōu)選特征的VH和VL類對(duì)的種系蛋白序列。最優(yōu)選地,本公開(kāi)內(nèi)容的集合包括抗體或其片段,其中VH和VL 二者的FR1、FR2和FR3包括具有優(yōu)選特征的VH 和VL類對(duì)的種系蛋白序列,其中VH和VL 二者的CDR3是高度多樣化的。在相關(guān)的實(shí)施方案中,所述編碼抗體或其片段的核酸的集合被克隆到載體中。適合的載體是本領(lǐng)域已知的,并且包括展示載體如噬菌體展示載體、質(zhì)粒載體、噬菌粒載體、 包括細(xì)菌表達(dá)載體或哺乳動(dòng)物表達(dá)載體的表達(dá)載體。在另外的相關(guān)實(shí)施方案中,集合或克隆到載體中的集合被轉(zhuǎn)化到宿主細(xì)胞中。因此,本發(fā)明包括宿主細(xì)胞的集合。適合的宿主細(xì)胞包括原核宿主細(xì)胞(如大腸桿菌)和真核宿主細(xì)胞(如哺乳動(dòng)物宿主細(xì)胞)。在另一實(shí)施方案中,本發(fā)明是包含來(lái)自約1345個(gè)幼稚的人B細(xì)胞或來(lái)自可讀介質(zhì)上的公開(kāi)可用的序列的VH/VL類對(duì)的數(shù)據(jù)庫(kù)。這種數(shù)據(jù)庫(kù)可用于本發(fā)明的集合和文庫(kù)的設(shè)計(jì)和構(gòu)建。本發(fā)明還包括生產(chǎn)編碼基本上代表免疫組庫(kù)的抗體或其片段的核酸的集合的方法。免疫組庫(kù)可以是一人或多人的幼稚B細(xì)胞或經(jīng)歷抗原的B細(xì)胞的免疫組庫(kù)。這種方法可包括如下步驟(a)鑒定以至少0. 05%、至少或至少2%的VH/VL類對(duì)的濃度在免疫組庫(kù)中存在的VH/VL類對(duì);(b)合成編碼如下抗體或其片段的核酸的集合所述抗體或其片段包含以至少0. 05%、至少1 %或至少2%的VH/VL類對(duì)的濃度在免疫組庫(kù)中存在的VH/VL 類對(duì)。該鑒定步驟可以不同方式進(jìn)行。例如,鑒定VH/VL類對(duì)可包括從一個(gè)或多個(gè)人宿主中分離幼稚B細(xì)胞,并且通過(guò)分離并測(cè)序編碼VH/VL類對(duì)的DNA、mRNA或cDNA或通過(guò)用對(duì)每個(gè)VH和VL特異的一種或多種核酸探針探測(cè)來(lái)確定每個(gè)B細(xì)胞中的VH/VL類對(duì),然后分析VH/VL類對(duì)。在可選的或補(bǔ)充的實(shí)施方案中,VH/VL類對(duì)可以從預(yù)先存在的數(shù)據(jù)庫(kù)如抗體序列數(shù)據(jù)庫(kù)中確定。在可選的或補(bǔ)充的實(shí)施方案中,VH/VL類對(duì)可以從文獻(xiàn)鑒定。因而, 在一個(gè)實(shí)施方案中,本發(fā)明包括獲得抗體核酸序列(預(yù)先存在的或重新產(chǎn)生的抗體核酸序列),通過(guò)序列比對(duì)確定VH/VL類對(duì),并且核對(duì)這些序列以鑒定免疫組庫(kù)中存在的VH/VL類對(duì)。在一些實(shí)施方案中,使用所述方法來(lái)產(chǎn)生其中大多數(shù)成員具有促進(jìn)抗體或其片段的生產(chǎn)和表達(dá)(例如在噬菌體上或從細(xì)胞)的有利的生物物理特性的集合,并且生產(chǎn)可溶的、熱穩(wěn)定的抗體。更具體地說(shuō),這些特性包括(i)有效地展示在噬菌體上;( )有效地展示在哺乳動(dòng)物細(xì)胞上;(iii)以Fab形式很好地表達(dá)在大腸桿菌中;(iv)以IgG形式很好地表達(dá)在哺乳動(dòng)物細(xì)胞中;(ν)熱穩(wěn)定性;(vi)可溶性;和(vii)低免疫原性。通過(guò)確定具有這些特性中的一些或全部特性的VH/VL類對(duì),人們可以例如通過(guò)只合成那些具有這類特性的核酸來(lái)構(gòu)建其中大多數(shù)成員具有這些生物物理特性的集合。因此,本發(fā)明包括這種集合以及制備這種集合的方法。在一些實(shí)施方案中,合成的核酸是種系、基本上的種系或其密碼子優(yōu)化的變體。可將變異引入至少一個(gè)互補(bǔ)決定區(qū)(⑶幻中。任何⑶R是合適的,尤其是⑶R3。優(yōu)選地,添加至⑶R的序列變異限于框內(nèi)序列并且不含半胱氨酸和終止密碼子,由此確保文庫(kù)的所有成員被正確地表達(dá)。合成了核酸后,可將其克隆到載體(如展示載體、噬菌體展示載體;噬菌粒載體; 或哺乳動(dòng)物表達(dá)載體)中,并且可將其轉(zhuǎn)化到宿主細(xì)胞中。適合的宿主細(xì)胞包括原核宿主細(xì)胞(例如大腸桿菌)和真核宿主細(xì)胞(例如哺乳動(dòng)物宿主細(xì)胞)。在另外的實(shí)施方案中,本發(fā)明提供了鑒定對(duì)免疫原特異的抗體的方法。在一個(gè)實(shí)施方案中,這種方法可以包括鑒定以至少0. 05%、至少或至少2%的VH/VL類對(duì)的濃度在免疫組庫(kù)中存在的VH/VL類對(duì);對(duì)編碼包含以至少0. 05%、至少或至少2%的VH/VL 類對(duì)的濃度在免疫組庫(kù)中存在的VH/VL類對(duì)的抗體或其片段的核酸的集合進(jìn)行合成;展示或表達(dá)該集合的抗體或其片段;針對(duì)特定免疫原篩選該集合;并且選擇對(duì)所述免疫原特異的至少一種抗體或其片段。因?yàn)楸景l(fā)明的方法和集合可以按照有利的生物物理特性來(lái)構(gòu)建,所以通過(guò)制備編碼具有這些有利特性的抗體或其片段的核酸的集合并針對(duì)特定免疫原進(jìn)行篩選來(lái)鑒定結(jié)合這種免疫原的抗體,本發(fā)明對(duì)于鑒定用于治療疾病或病癥的抗體或其抗體片段是特別有用的。在一些方面,本發(fā)明涉及包含VH/VL對(duì)的抗體或其片段的集合或文庫(kù)。在一些實(shí)施方案中,抗體或其片段的集合或文庫(kù)包含由免疫組庫(kù)中豐富的VH和VL種系家族和/或基因編碼的種系蛋白序列。在一些實(shí)施方案中,本發(fā)明涉及包含由具有某些有利的生物物
54理特征的VH和VL種系家族和/或基因編碼的種系蛋白序列的抗體或其片段的集合或文庫(kù)。在一些實(shí)施方案中,VH和VL種系家族和/或基因是免疫組庫(kù)中天然存在的那些,并且在該文庫(kù)中是更豐富的或更普遍的。在一些實(shí)施方案中,抗體或其片段的集合或文庫(kù)包含由VH和VL種系家族和/或基因編碼的種系蛋白序列。在一些實(shí)施方案中,抗體或其片段的集合或文庫(kù)包括來(lái)自種系、基本上的種系或密碼子優(yōu)化的VH和VL種系家族和/或基因的構(gòu)架區(qū)和/或CDR區(qū)。在一些實(shí)施方案中,抗體或其片段的集合或文庫(kù)包含由合成的、通過(guò)全基因合成而構(gòu)建的VH和VL種系家族和/或基因編碼的種系蛋白序列。在一些實(shí)施方案中,抗體或其片段的集合或文庫(kù)包含由合成的、通過(guò)全基因合成而構(gòu)建的VH和VL種系家族和/或基因的部分。在一些實(shí)施方案中,抗體或其片段的集合或文庫(kù)包括由具有有利的生物物理特性的VH和VL種系家族和/或基因編碼的種系蛋白序列,所述有利的生物物理特性幫助篩選和進(jìn)一步研發(fā)尤其是在治療背景下的抗體。有利的生物物理特性包括但不限于(i)它們以Fab形式被很好地展示在噬菌體上;(ii)它們以IgG形式被很好地展示在哺乳動(dòng)物細(xì)胞上;(iii)它們以Fab形式被大量表達(dá)在例如大腸桿菌中,以及以IgG形式被大量表達(dá)在例如哺乳動(dòng)物細(xì)胞中;(iv)是熱力學(xué)穩(wěn)定的;(ν)具有高血清穩(wěn)定性;(vi)具有低聚集傾向(即高可溶性);和(vii)具有低免疫原性風(fēng)險(xiǎn)。在其他方面,本公開(kāi)內(nèi)容的集合包括含優(yōu)選的VH和VL類對(duì)的種系蛋白序列的抗體或其片段。本公開(kāi)內(nèi)容的集合優(yōu)選地包括抗體或其片段,其中一個(gè)或更多個(gè)構(gòu)架區(qū)包括由具有優(yōu)選的特征的VH和VL類對(duì)編碼的種系蛋白序列,特別是其中VH和VL的FR1、FR2 和FR3包括具有優(yōu)選的特征的VH和VL類對(duì)的種系蛋白序列。CDR可以是高度多樣化的。 優(yōu)選地,VH和VL 二者的⑶R3是高度多樣化的。在一些實(shí)施方案中,VH和/或VL的⑶Rl 和CDR2是種系序列或基本上的種系序列。這種策略提高了本公開(kāi)內(nèi)容的集合包括能夠被開(kāi)發(fā)用于治療用途的針對(duì)任何免疫原的抗體或其片段的概率,因?yàn)榧现写嬖诘拇蠖鄶?shù)抗體或其片段包括具有以上優(yōu)選特征的VH和VL對(duì)的種系序列。選擇的抗體還將具有低免疫原性和對(duì)特定抗原的高親和力。 該結(jié)果極大地提高了從公開(kāi)的集合選擇的抗體或其片段針對(duì)任何免疫原是高效的且可被研發(fā)用于治療或診斷目的的概率。這些集合克服了現(xiàn)有技術(shù)的許多問(wèn)題。例如,在源自B細(xì)胞的同源文庫(kù)中,該文庫(kù)存在的VH和VL類配對(duì)取決于樣品中存在的類配對(duì)。如果取得足夠大的B細(xì)胞樣品,大約 50個(gè)VH和50個(gè)VL的類配對(duì)組合(約2500個(gè))中的每一個(gè)都將存在。存在如此多的VH 和VL類對(duì)可比擬背景噪聲。產(chǎn)生只包括最普遍的VH和VL類對(duì)的大多樣性的文庫(kù)可能是令人期望的,但是對(duì)于同源文庫(kù)方法,這是不可能的。此外,在一些實(shí)施方案中,集合所基于的DNA序列是從未經(jīng)歷抗原的幼稚B細(xì)胞的樣品獲得,因此,所表達(dá)的成員不偏向于特定抗原并且可以使用集合來(lái)針對(duì)任何免疫原進(jìn)行篩選。因此,可對(duì)從人宿主的幼稚(未經(jīng)歷抗原的)B細(xì)胞獲得的編碼抗體或其片段的核酸序列(或其選定部分)進(jìn)行測(cè)序。從這些序列數(shù)據(jù),可鑒定在免疫組庫(kù)中主要代表的種系家族VH/VL鏈類配對(duì)?;谀承┲笜?biāo)如普遍性,選擇重鏈和輕鏈類對(duì)加入集合中。然后可通過(guò)基因合成來(lái)合成集合。在一些實(shí)施方案中,合成的集合包括基本上的種系VH和VL 構(gòu)架區(qū),其中CDR是多樣化的。
利用從例如人宿主的幼稚(未經(jīng)歷抗原的)B細(xì)胞或從公開(kāi)可用的數(shù)據(jù)庫(kù)或文獻(xiàn)獲得的DNA序列作為“模板”,本公開(kāi)內(nèi)容使得鑒定最普遍的VH和VL種系家族和/或基因和/或類對(duì)的方法成為可能。闡釋了 VH和VL種系家族和/或基因和/或類對(duì)的相對(duì)豐度后,就可以測(cè)試包含由VH和VL種系家族和/或基因和/或類對(duì)編碼的種系蛋白序列的抗體或其片段的如下優(yōu)選特征(i)它們以Fab形式被很好地展示在噬菌體上;(ii)它們以Fab 形式和IgG形式被大量表達(dá);(iii)并且它們是熱力學(xué)穩(wěn)定的。通過(guò)測(cè)試由最普遍的VH和 VL種系家族和/或基因和/或類對(duì)編碼的種系蛋白序列,可鑒定具有優(yōu)選特征的那些。利用這種信息,技術(shù)人員能夠產(chǎn)生高度的多樣性而不犧牲可歸因于最普遍的VH和VL種系家族和/或基因和/或類對(duì)組合的關(guān)鍵益處。利用本文公開(kāi)的集合設(shè)計(jì)和展示方法,可產(chǎn)生大多樣性的集合,因?yàn)橐恍?shí)施方案包括至少I(mǎi)X 101°種成員的集合。本公開(kāi)內(nèi)容總體上涉及包含具有最優(yōu)選的特征的VH和VL類對(duì)的合成抗體集合。 在一些實(shí)施方案中,集合包括由類對(duì)代表的VH和VL家族編碼的種系蛋白序列。本公開(kāi)內(nèi)容總體上涉及包含具有優(yōu)選的特征的一個(gè)或更多個(gè)VH和VL類對(duì)的合成抗體集合。在一些方面,集合包括由類對(duì)代表的VH和VL家族編碼的種系蛋白序列。在一些方面,本公開(kāi)內(nèi)容使得鑒定在免疫組庫(kù)中最普遍的VH和VL種系基因、測(cè)試具有最普遍的VH和VL種系基因序列的抗體以鑒定具有優(yōu)選特征的VH和VL種系基因、并然后產(chǎn)生包含優(yōu)選的VH和VL類對(duì)的集合的方法成為可能。本公開(kāi)內(nèi)容使得鑒定在人免疫組庫(kù)(可能是幼稚的)中的VH和VL類對(duì)、確定最普遍的VH和VL類對(duì)、測(cè)試這些VH和VL 類對(duì)以鑒定具有優(yōu)選特征的VH和VL類對(duì)、并然后產(chǎn)生包含優(yōu)選的VH和VL類對(duì)的集合和 /或源自于優(yōu)選的VH和VL種系基因的抗體的方法成為可能。一旦鑒定了 VH和VL和/或 VH和VL類對(duì),就鑒定了它們相應(yīng)的種系序列,這樣可將種系序列加入到集合設(shè)計(jì)中。在一些方面,本公開(kāi)內(nèi)容使得包含公開(kāi)的核酸集合的載體和宿主細(xì)胞成為可能。在一些方面,本公開(kāi)內(nèi)容使得生產(chǎn)這些集合的方法成為可能。在一些實(shí)施方案中,在單獨(dú)步驟中獲得代表人免疫組庫(kù)的DNA序列,并將其儲(chǔ)存在數(shù)據(jù)庫(kù)中;因此,集合設(shè)計(jì)可經(jīng)由計(jì)算機(jī)模擬被容易地改變、優(yōu)化和定制,容許通??稍诤铣晌膸?kù)中實(shí)現(xiàn)的定制水平。在一些方面,本公開(kāi)內(nèi)容使得利用所公開(kāi)的集合鑒定抗體或其片段的方法成為可能。方法、核酸、蛋白、載體、宿主細(xì)胞在一方面,本公開(kāi)內(nèi)容使得由全基因合成產(chǎn)生的核酸的集合成為可能。基因合成技術(shù)近年已取得相當(dāng)大的進(jìn)展并且可產(chǎn)生非常大的核酸集合。以下公司提供了這種合成月艮務(wù)Entelechon (Regensburg、Germany)、Geneart (Regensburg、Germany)禾口 Sloning Biotechnology (PuchheinuGermany)。為了使基因合成公司得以產(chǎn)生集合,可提供該集合的每個(gè)成員的序列。在一些實(shí)施方案中,本公開(kāi)內(nèi)容使得編碼包含以至少0. 05%的VH和VL類對(duì)的濃度存在于至少1 X IO5個(gè)B細(xì)胞的樣品中的VH和VL類對(duì)的抗體或其片段的合成核酸的集合成為可能。在其他實(shí)施方案中,本公開(kāi)內(nèi)容的集合包括以至少1 %的VH和VL類對(duì)的濃度存在于至少I(mǎi)XlO5個(gè)B細(xì)胞的樣品中的VH和VL類對(duì)。在其他實(shí)施方案中,本公開(kāi)內(nèi)容的集合包括以至少1.5%的VH和VL類對(duì)的濃度存在于至少I(mǎi)XlO5個(gè)B細(xì)胞的樣品中的VH 和VL類對(duì)。在其他實(shí)施方案中,本公開(kāi)內(nèi)容的集合包括以至少2%的VH和VL類對(duì)的濃度存在于至少I(mǎi)XlO5個(gè)B細(xì)胞的樣品中的VH和VL類對(duì)。在其他實(shí)施方案中,本公開(kāi)內(nèi)容的集合包括以至少3%的VH和VL類對(duì)的濃度存在于至少1 X IO5個(gè)B細(xì)胞的樣品中的VH和 VL類對(duì)。在其他實(shí)施方案中,本公開(kāi)內(nèi)容的集合包括以至少4%的VH和VL類對(duì)的濃度存在于至少I(mǎi)XlO5個(gè)B細(xì)胞的樣品中的VH和VL類對(duì)。在其他實(shí)施方案中,本公開(kāi)內(nèi)容的集合包括以至少5%的VH和VL類對(duì)的濃度存在于至少1 X IO5個(gè)B細(xì)胞的樣品中的VH和VL 類對(duì)。在一些實(shí)施方案中,本公開(kāi)內(nèi)容使得其中從分離自人宿主的B細(xì)胞中鑒定VH和VL 類對(duì)的集合成為可能。在一些實(shí)施方案中,B細(xì)胞是幼稚的。在一些實(shí)施方案中,核酸的集合編碼包含VH和VL構(gòu)架區(qū)的抗體或其片段。在優(yōu)選的實(shí)施方案中,核酸的集合被合成包括具有多樣化的CDR的種系VH和VL構(gòu)架區(qū)。種系構(gòu)架區(qū)是令人期望的,因?yàn)榘N系構(gòu)架區(qū)的抗體或其片段不可能具有免疫原性。利用本文公開(kāi)的集合設(shè)計(jì)和展示方法,可產(chǎn)生大多樣性的集合,因?yàn)橐恍?shí)施方案包括至少1XIO4種核酸序列的集合,一些實(shí)施方案包括至少1 X 105、106、IO7,108、109、 IOloUO11或IO12種核酸序列的集合。這種多樣性是通過(guò)合成包括如下成員的集合而產(chǎn)生 所述成員包括具有多樣化的CDR的普遍的VH和VL類對(duì)。本公開(kāi)內(nèi)容的集合是從基本上代表免疫組庫(kù)的序列數(shù)據(jù)而設(shè)計(jì)。在一些實(shí)施方案中,序列數(shù)據(jù)是通過(guò)檢索公開(kāi)可用的免疫球蛋白序列表而獲得。例如,可利用Ig-Blast檢索NCBI或者可檢索公開(kāi)可用的文獻(xiàn)。到2005年為止,該數(shù)據(jù)庫(kù)包括至少25,000種FASTA 格式的人重排抗體序列。在22,500個(gè)條目中,13,235個(gè)代表VH序列,1,506個(gè)代表V κ并且2,259個(gè)代表V λ。從這些序列中,VH、Vk和V λ可歸類為其對(duì)應(yīng)的種系家族和/或基因。因?yàn)橐恍㊣g-Blast包括完全的抗體序列,每個(gè)VH和VL結(jié)構(gòu)域類配對(duì)的正確的種系家族和/或基因可從數(shù)據(jù)庫(kù)序列確定。如果利用這種方法,本領(lǐng)域技術(shù)人員能夠容易地確定每個(gè)VH和VL種系家族和/或基因的突出性(prominence)和/或每個(gè)VH和VL結(jié)構(gòu)域類對(duì)的種系家族和/或基因。選擇哪些VH和VL和/或VH和VL類對(duì)加入文庫(kù)中能夠以許多方式完成。在一些實(shí)施方案中,選擇具有最高普遍性的VH和VL加入集合或文庫(kù)中。在一些實(shí)施方案中,選擇具有有利的生物物理特性的VH和VL加入集合或文庫(kù)中。在一些實(shí)施方案中,選擇具有最高普遍性的VH和VL類對(duì)加入集合或文庫(kù)中。在一些實(shí)施方案中,選擇具有有利的生物物理特性的VH和VL類對(duì)加入集合或文庫(kù)中。在一些實(shí)施方案中,選擇具有最高普遍性和/或有利的生物物理特性的VH和VL和/或具有最高普遍性的VH和VL類對(duì)和/或具有有利的生物物理特性的VH和VL類對(duì)加入集合或文庫(kù)中。這種方法的一個(gè)缺點(diǎn)是公開(kāi)可用的數(shù)據(jù)庫(kù)通常填充了針對(duì)特定免疫原而產(chǎn)生的抗體的序列,因此這些序列是有偏性的。此外,在大部分?jǐn)?shù)據(jù)庫(kù)中,重鏈和輕鏈的序列是不相聯(lián)系的,因此不能鑒定VH和VL類配對(duì)。在一些實(shí)施方案中,核酸序列通過(guò)如下方式獲得從一個(gè)或更多個(gè)宿主收獲B細(xì)胞,從B細(xì)胞分離DNA,并且優(yōu)選地對(duì)DNA測(cè)序。優(yōu)選地,B細(xì)胞是幼稚的。B細(xì)胞的樣品是從一個(gè)或更多個(gè)人供體收獲的。以下是可用于分離B細(xì)胞的技術(shù)。通過(guò)使用以抗CD43和抗Mac-1/CDllb單克隆抗體(例如經(jīng)磁性微珠)針對(duì)其他細(xì)胞類型的陰性選擇從脾臟中分離靜息B淋巴細(xì)胞(B細(xì)胞)。這種策略從脾細(xì)胞的混合群中去除非B細(xì)胞并且依靠如下事實(shí)除了靜息的脾B細(xì)胞之外大多數(shù)成熟的白細(xì)胞表達(dá)CD43 (事實(shí)上,除了粒細(xì)胞、單核細(xì)胞、巨噬細(xì)胞、血小板、自然殺傷(NK)細(xì)胞、胸腺細(xì)胞和外周CD8+細(xì)胞和大多數(shù)CD4+T細(xì)胞之外,⑶43的表達(dá)顯示在不成熟的B細(xì)胞、漿細(xì)胞和某些成熟細(xì)胞上)??筂ac-I/⑶lib 微珠被包括在陰性選擇中以改善髓樣細(xì)胞的除去。通過(guò)利用AutoMACS自動(dòng)磁珠細(xì)胞分選儀(Miltenyi Biotec),B細(xì)胞分離可以是自動(dòng)化的。如通過(guò)B220+細(xì)胞的熒光分析所評(píng)定的,這種分離常規(guī)地產(chǎn)生> 95%純的大約4X IO7個(gè)B細(xì)胞/脾臟。還參見(jiàn)Miltenyi S, Muller W, Weichel W 禾口 RadbruchA. (1990)Cytometry 11 U),231-238。所收獲的B細(xì)胞的數(shù)目基本上代表免疫組庫(kù)。在一些實(shí)施方案中,至少I(mǎi)X IO4個(gè) B細(xì)胞從宿主分離,更優(yōu)選至少I(mǎi)O5個(gè)B細(xì)胞、更優(yōu)選至少I(mǎi)O6個(gè)B細(xì)胞、最優(yōu)選IO7個(gè)B細(xì)胞從宿主分離。編碼來(lái)自B細(xì)胞的抗體或其片段的DNA被分離并擴(kuò)增,例如,重鏈和輕鏈通過(guò) PCR反應(yīng)連接。DNA被優(yōu)選地測(cè)序。測(cè)序的DNA可以是從B細(xì)胞mRNA產(chǎn)生的cDNA。從真核細(xì)胞如B細(xì)胞提取mRNA是公知的技術(shù)程序。存在許多技術(shù)方案并且商業(yè)試劑盒是可用的。如PolyATtract mRNA 分離系統(tǒng)(Promega,Madison, WI, USA)或多種 RNeasy 和 OligotexDirectmRNA試劑盒(均來(lái)自于Qiagen,Hilden, Germany)。這些技術(shù)中許多利用真核mRNA的聚腺苷酸尾,例如經(jīng)由對(duì)oligo (dT)基質(zhì)如oligo(dT)纖維素的親和純化??梢岳锰囟ㄒ锝?jīng)反轉(zhuǎn)錄接著通過(guò)常規(guī)PCR從分離的mRNA選擇性擴(kuò)增cDNA。 特定引物用于擴(kuò)增可變重鏈和可變輕鏈結(jié)構(gòu)域核酸。參見(jiàn)Cancer Surv. 1997 ;30 =21-44, J Clin. Pathol. 1994 ;47 :493-6, J. Clin. Pathol. 1990 ;43 :888-90 或 Mol. Pathol. 2002 年 4 月;55(2) :98-101。將編碼來(lái)自一個(gè)B細(xì)胞的可變和可變輕鏈結(jié)構(gòu)域的DNA保持在一起,以使得可以鑒定可變結(jié)構(gòu)域重鏈和輕鏈類配對(duì)。用于分離編碼個(gè)體B細(xì)胞的可變結(jié)構(gòu)域配對(duì)的核酸的技術(shù)是本領(lǐng)域公知的。見(jiàn),例如,W001/92291 ;W092/15678 ;W093/03151, W02005/042774 ; Mullinax RL 等人,19^Biotechniques 12 :6864-868 ;Chapal,N.等人 1997Biotechniques 23,518-524,, Embleton MJ 等人,1992Nucleic Acids Res. 20 15,3831—3837 ;Coronella, J. Α.等人2000Nucleic Acids Res. 28 :20,E85 ;Thirion S等人,1996European Journal of Cancer Prevention 5 :6507-511 ;禾口 Wang,X 等人 2000 J. Immunol. Methods20,217—225。這些技術(shù)可被單獨(dú)使用或與其他方法組合使用。例如,如果大樣品的可變重鏈和輕鏈結(jié)構(gòu)域序列沒(méi)有從其對(duì)應(yīng)的B細(xì)胞中被一起成功地鑒定,那么可完成以下方法,以鑒定正確的可變重鏈和可變輕鏈結(jié)構(gòu)域類對(duì)。完成了每個(gè)個(gè)體B細(xì)胞的單細(xì)胞PCR。優(yōu)選地,來(lái)自每個(gè)B細(xì)胞的DNA被測(cè)序。存在多家能夠?qū)φ麄€(gè)基因組測(cè)序的公司, 如 Helicos Biosciences Corporation (Cambridge, MA, USA) Helicos 能夠用其真實(shí)單分子測(cè)序(True Single Molecule Sequencing )技術(shù)直接以高速度和高效率對(duì)DNA或RNA 的單分子測(cè)序。能夠進(jìn)行類似測(cè)序工作的其他公司包括Illumina(San Diego, CA, US A ; Solexa system)和Roche (Basel, CH ;454系統(tǒng))。在測(cè)序之前不需要克隆步驟。在另一方面,本公開(kāi)內(nèi)容使得鑒定免疫組庫(kù)中存在的重鏈和輕鏈可變結(jié)構(gòu)域?qū)Φ姆N系家族的方法成為可能。使用本領(lǐng)域技術(shù)人員已知的方法可將所有抗體或其片段追溯到其種系家族。通過(guò)分析編碼抗體或其片段的核酸的序列,VH和VL 二者的種系家族可通過(guò)
58本領(lǐng)域技術(shù)人員已知的方法確定。例如,Wildt等人,(1999)從3位患者中采樣B細(xì)胞并鑒定了 365種VH和VL類配對(duì)。將來(lái)自每個(gè)B細(xì)胞的RNA用于cDNA合成并且對(duì)編碼VH和 VL區(qū)的cDNA進(jìn)行PCR擴(kuò)增和測(cè)序。如Wildt的圖1所示,某些VH和VL類比其他VH和VL 類更頻繁配對(duì),例如,VH3-8 與 V κ 3-1、V κ 3-19, V κ 4-1, V κ 2-3 ^ V κ 1-2,以及 VH3-9 與 Vk 3-1、V κ 3-3 或 Vk 1-5。在另一方面,本公開(kāi)內(nèi)容使得在合成集合之前設(shè)計(jì)多樣化的互補(bǔ)決定區(qū)的方法成為可能。CDR可通過(guò)本領(lǐng)域公知的方法設(shè)計(jì),包括在Knappik等人2000 ;WO 97/08320中公開(kāi)的方法。在另一方面,本公開(kāi)內(nèi)容使得選擇期望被包括在編碼抗體或其片段的核酸的集合中的可變結(jié)構(gòu)域類配對(duì)的方法成為可能。在一些實(shí)施方案中,合成了包含由公開(kāi)的方法鑒定的所有VH和VL結(jié)構(gòu)域類對(duì)的核酸的集合。此外,VH和VL類對(duì)的普遍性可通過(guò)多種統(tǒng)計(jì)檢驗(yàn)確定。最簡(jiǎn)單的形式是,簡(jiǎn)單地計(jì)數(shù)個(gè)體VH和VL類對(duì)。更復(fù)雜的統(tǒng)計(jì)檢驗(yàn)可考慮各種其他參數(shù)。通過(guò)非限制性實(shí)例的方式,以下統(tǒng)計(jì)檢驗(yàn)和參考文獻(xiàn)可作為已在這種或類似的分析中進(jìn)行大量探討的實(shí)例來(lái)指導(dǎo)貝葉斯壓縮估計(jì)(Bayesian Shrinkage Estimation)(見(jiàn)例如,Biometrics 59(2003) 476-486),DADA (cDNA豐度的數(shù)字分析,見(jiàn)例如,BMC Genomics 2002,3 7),線性建模(太平洋生物計(jì)算討論會(huì)(Pacific Symposium on Biocomputing),1999,4 :41-52)和各種聚類方法(BMC Bioinformatics 2006,7 :397,第 4 次 IEEE 國(guó)際數(shù)據(jù)挖掘會(huì)議(Fourth IEEE International Conference on Data Mining(ICDM' 04)),H 403—406 M)。在其他方面,本公開(kāi)內(nèi)容使得包含編碼抗體或其片段的核酸集合的載體的集合成為可能。在一些實(shí)施方案中,載體包含表達(dá)載體、展示載體、噬菌體展示載體或噬菌粒載體。真核表達(dá)載體是本領(lǐng)域公知的并且還可商購(gòu)獲得。通常,提供這些載體包含用于插入期望的DNA的便利的限制酶切位點(diǎn)。這些載體的實(shí)例包括pSVL和pKSV-10、pBPV-1/ PML2d 和 pTDTl (ATCC,編號(hào) 31255)。在其他方面,本公開(kāi)內(nèi)容使得用公開(kāi)的載體集合轉(zhuǎn)化的宿主細(xì)胞的集合成為可能。宿主細(xì)胞可以是真核的或原核的。細(xì)菌細(xì)胞是優(yōu)選的原核宿主細(xì)胞并且通常是大腸桿菌(Escherichia coli, Ε. coli)的菌株,諸如,例如,可從 Bethesck Research Laboratories, Inc.,Bethesda, Md獲得的大腸桿菌菌株DH5。優(yōu)選的真核宿主細(xì)胞包括酵母和哺乳動(dòng)物細(xì)胞,包括鼠類細(xì)胞和嚙齒類細(xì)胞,優(yōu)選脊椎動(dòng)物細(xì)胞,如來(lái)自小鼠、大鼠、猴或人細(xì)胞系的細(xì)胞。引入載體到宿主細(xì)胞中可通過(guò)本領(lǐng)域技術(shù)人員已知的許多轉(zhuǎn)化或轉(zhuǎn)染方法完成, 包括磷酸鈣沉淀、電穿孔、顯微注射、脂質(zhì)體融合、RBC血影(ghost)融合、原生質(zhì)體融合、病毒感染以及類似方法。單克隆全長(zhǎng)抗體、Fab片段、Fv片段和scFv片段的生產(chǎn)是公知的。用重組DNA分子轉(zhuǎn)化適當(dāng)?shù)募?xì)胞宿主是通過(guò)通常取決于所用的載體類型的方法而完成。關(guān)于原核宿主細(xì)胞的轉(zhuǎn)化,見(jiàn),例如,Cohen等人,Proceedings National Academy of Science, USA,第 69 卷,第 2110 頁(yè)(1972);和 Maniatis 等人,Molecular Cloning, a Laboratory Manual (分子克隆實(shí)驗(yàn)室指南),冷泉港實(shí)驗(yàn)室,冷泉港,紐約(1982)。關(guān)于用包含rDNA的逆轉(zhuǎn)錄病毒載體轉(zhuǎn)化脊椎動(dòng)物細(xì)胞,見(jiàn)例如,Sorge等人,Mol. Cell. Biol., 4 :1730-1737(1984) ;Graham 等人,Virol. ,52 :456(1973);禾口 Wigler 等人,ProceedingsNational Academy ofSciences,USA,第 76 卷,第 1373-1376 頁(yè)(1979)。在另一方面,本公開(kāi)內(nèi)容使得包含如下序列數(shù)據(jù)的試劑盒或數(shù)據(jù)庫(kù)成為可能,所述序列數(shù)據(jù)闡述編碼如下抗體或其片段的核酸所述抗體或其片段包含在至少I(mǎi)X IO5個(gè)幼稚的人B細(xì)胞的樣品中存在的核酸,其中所述序列數(shù)據(jù)在可讀介質(zhì)上。在另一方面,本公開(kāi)內(nèi)容使得生產(chǎn)編碼抗體或其片段的合成核酸的集合的方法成為可能,所述方法包括合成編碼包含以至少0. 05%的VH和VL類對(duì)存在于至少約2500個(gè)B 細(xì)胞的樣品中的VH和VL類對(duì)的抗體或其片段的核酸的集合。在一些實(shí)施方案中,本公開(kāi)內(nèi)容使得生產(chǎn)編碼基本上代表免疫組庫(kù)的抗體或其片段的核酸的集合的方法成為可能,所述方法包括(a)鑒定以至少0. 05%、至少或至少2%的VH/VL類對(duì)的濃度在免疫組庫(kù)中存在的VH/VL類對(duì);(b)合成編碼如下抗體或其片段的核酸的集合所述抗體或其片段包含以至少0. 05%、至少1 %或至少2%的VH/VL類對(duì)的濃度在免疫組庫(kù)中存在的VH/VL類對(duì)。在一些實(shí)施方案中,鑒定VH/VL類對(duì)包括(i)從一個(gè)或更多個(gè)人宿主中分離B細(xì)胞; (ii)通過(guò)選自如下的方法確定每個(gè)B細(xì)胞中的VH/VL類對(duì)(A)對(duì)編碼VH/VL類對(duì)的DNA、 mRNA或cDNA進(jìn)行分離并測(cè)序;或(B)用對(duì)每個(gè)VH和VL特異的一種或更多種核酸探針進(jìn)行探測(cè);和(iii)分析VH/VL類對(duì)。在一些實(shí)施方案中,鑒定VH/VL類對(duì)包括(i)獲得抗體核酸序列;(ii)通過(guò)序列比對(duì)確定VH/VL類對(duì);(iii)核對(duì)這些來(lái)自至少100種抗體的序列以鑒定在免疫組庫(kù)中存在的VH/VL類對(duì)。在一些實(shí)施方案中,這些方法包括選擇顯示選自以下組成的組的至少一種生物物理特性的VH/VL類對(duì)(i)有效地展示在噬菌體上;(ii) 有效地展示在哺乳動(dòng)物細(xì)胞上;(iii)以Fab形式很好地表達(dá)在大腸桿菌中;(iv)以IgG形式很好地表達(dá)在哺乳動(dòng)物細(xì)胞中;(ν)熱穩(wěn)定性;(vi)可溶性;和(vii)低免疫原性;以及合成編碼顯示至少一種所述生物物理特性的抗體或其片段的核酸的集合。在一些實(shí)施方案中,編碼抗體或其片段的核酸的集合是種系、基本上的種系或密碼子優(yōu)化的種系核酸的變體。在一些實(shí)施方案中,在合成編碼含VH/VL類對(duì)的抗體或其片段的核酸的集合的過(guò)程中, 將序列變異引入至少一個(gè)互補(bǔ)決定區(qū)(CDR)中。在一些實(shí)施方案中,序列變異限于不含終止密碼子的序列。在一些實(shí)施方案中,這些方法還包括將核酸的集合克隆到載體中。在一些實(shí)施方案中,載體選自以下組成的組(i)展示載體,(ii)噬菌體展示載體;(iii)噬菌粒載體;和(iv)哺乳動(dòng)物表達(dá)載體。在一些實(shí)施方案中,這些方法還包括轉(zhuǎn)化到宿主細(xì)胞中。在一些實(shí)施方案中,宿主細(xì)胞選自由以下組成的組(i)原核宿主細(xì)胞;(ii)真核宿主細(xì)胞(iii)大腸桿菌宿主細(xì)胞;和iv)哺乳動(dòng)物宿主細(xì)胞。一些實(shí)施方案還包括將所述核酸插入載體的集合中并且轉(zhuǎn)化/轉(zhuǎn)染到宿主細(xì)胞中并展示抗體或其片段。在一些實(shí)施方案中,載體是表達(dá)載體、展示載體,如噬菌粒載體。一些實(shí)施方案還包括將所述載體轉(zhuǎn)染到適合的宿主細(xì)胞中。在一些實(shí)施方案中,宿主細(xì)胞是原核的,例如大腸桿菌,或是真核的,例如哺乳動(dòng)物細(xì)胞。在另一方面,本公開(kāi)內(nèi)容使得鑒定對(duì)免疫原特異的抗體或其抗體片段的方法成為可能,所述方法包括如下步驟合成編碼如下抗體或其片段的核酸的集合所述抗體或其片段包含以至少0. 05%的VH和VL類對(duì)的濃度存在于至少約2500個(gè)B細(xì)胞的樣品中的VH 和VL類對(duì);針對(duì)特定免疫原篩選該集合;并且選擇對(duì)所述免疫原特異的一種或更多種抗體或其片段。一些實(shí)施方案包括鑒定對(duì)免疫原特異的抗體或其抗體片段的方法,所述方法包括如下步驟(a)鑒定以至少0. 05%、至少或至少2%的VH/VL類對(duì)的濃度在免疫組庫(kù)中存在的VH/VL類對(duì);(b)對(duì)編碼包含以至少0. 05%、至少或至少2%的VH/VL類對(duì)的濃度在免疫組庫(kù)中存在的VH/VL類對(duì)的抗體或其片段的核酸的集合進(jìn)行合成;(c)展示或表達(dá)該集合的抗體或其片段;(d)針對(duì)特定免疫原篩選該集合;和(e)選擇對(duì)所述免疫原特異的至少一種抗體或其片段。一些實(shí)施方案包括鑒定用于治療疾病或病癥的抗體或其抗體片段的方法,所述方法包括如下步驟(a)鑒定以至少0. 05%、至少或至少2%的VH/VL 類對(duì)的濃度在免疫組庫(kù)中存在的VH/VL類對(duì);(b)鑒定顯示選自以下組成的組的至少一種生物物理特性的VH/VL類對(duì)(i)有效地展示在噬菌體上;(ii)有效地展示在哺乳動(dòng)物細(xì)胞上;(iii)以Fab形式很好地表達(dá)在大腸桿菌中;(iv)以IgG形式很好地表達(dá)在哺乳動(dòng)物細(xì)胞中;(ν)熱穩(wěn)定性;(vi)可溶性;和(vii)低免疫原性;(c)合成編碼如下抗體或其片段的核酸的集合所述抗體或其片段包含以至少0. 05%、至少或至少2%的VH/VL類對(duì)的濃度在免疫組庫(kù)中存在并展示(i)-(vii)的至少一種生物物理特性的VH/VL類對(duì);(d)展示或表達(dá)來(lái)自所述集合的抗體或其片段;(e)針對(duì)與所述疾病或病癥相關(guān)的特定免疫原篩選該集合;和(f)選擇對(duì)所述免疫原特異的至少一種抗體或其片段。在一些實(shí)施方案中,B細(xì)胞分離自人宿主。在一些實(shí)施方案中,B細(xì)胞是幼稚的。 在一些實(shí)施方案中,在至少1 X約2500個(gè)B細(xì)胞的樣品中存在的VH和VL類對(duì)是通過(guò)如下方法鑒定的所述方法包括從一個(gè)或更多個(gè)人宿主收獲幼稚B細(xì)胞;從收獲的B細(xì)胞中分離DNA ;并且分析所分離的DNA。在一些實(shí)施方案中,分析DNA的步驟包括對(duì)DNA測(cè)序。在一些實(shí)施方案中,分析DNA的步驟還包括鑒定每個(gè)VH和VL類對(duì)在樣品中存在的頻率。一些實(shí)施方案還包括將所述核酸插入載體的集合中并且轉(zhuǎn)化/轉(zhuǎn)染到宿主細(xì)胞中,并展示抗體或其片段。在另一方面,本公開(kāi)內(nèi)容使得鑒定對(duì)免疫原特異的抗體或其抗體片段的方法成為可能,所述方法包括如下步驟合成編碼如下抗體或其片段的核酸的集合所述抗體或其片段包含以至少0. 05%的VH和VL類對(duì)的濃度存在于至少約2500個(gè)B細(xì)胞的樣品中的VH 和VL類對(duì);針對(duì)特定免疫原篩選該集合;并且選擇對(duì)所述免疫原特異的一種或更多種抗體或其片段。在一些實(shí)施方案中,B細(xì)胞分離自人宿主。在一些實(shí)施方案中,B細(xì)胞是幼稚的。 在一些實(shí)施方案中,在至少約2500個(gè)B細(xì)胞的樣品中的VH和VL類對(duì)是通過(guò)如下方法鑒定的所述方法包括從一個(gè)或更多個(gè)人宿主收獲B細(xì)胞;從收獲的B細(xì)胞中分離DNA ;并且分析所分離的DNA。在一些實(shí)施方案中,分析DNA的步驟包括對(duì)DNA測(cè)序。在一些實(shí)施方案中,分析DNA的步驟還包括鑒定每個(gè)VH和VL類對(duì)在樣品中存在的頻率。在一些實(shí)施方案中,在測(cè)試/篩選之前利用噬菌體、酵母、核糖體、細(xì)菌或真核的展示來(lái)展示集合。在一些實(shí)施方案中,集合被展示在原核或真核細(xì)胞上。在一些實(shí)施方案中,集合以Fab或IgG形式或其他本領(lǐng)域技術(shù)人員已知的形式展示。篩選可以通過(guò)使用本領(lǐng)域公知的方法之一進(jìn)行,例如噬菌體展示、選擇性感染的噬菌體、篩選結(jié)合的多核糖體技術(shù)、以及用于酶活性或蛋白穩(wěn)定性的測(cè)定系統(tǒng)。許多這類方法是本領(lǐng)域技術(shù)人員已知的并且作為示例性參考文獻(xiàn)在以下提供Valle RP, Curr. Opin.Drug Discov. Devel. 2003 ¥ 3 月;6 (2) :197-203 ;Ackermann BL Expert Rev. Proteomics. 2007 年 4 月;4 (2) :175-86 ;禾口 Anderson KS J Proteome Res. 2005 年 7—8 月; 4(4) 1123-33。
61
在一個(gè)實(shí)施方案中,進(jìn)行篩選測(cè)定以使得抗體對(duì)配體的結(jié)合直接或間接產(chǎn)生可檢測(cè)的信號(hào)。這些信號(hào)包括,例如,復(fù)合物的產(chǎn)生、催化反應(yīng)產(chǎn)物的形成、能量的釋放或攝取,等等。來(lái)自用主題的重組DNA進(jìn)行轉(zhuǎn)化的群體的細(xì)胞可被克隆以產(chǎn)生例如單克隆集落??梢詫?lái)自這些集落的細(xì)胞收獲、裂解并且用本領(lǐng)域已知的方法檢驗(yàn)其DNA內(nèi)容物的重組DNA的存在,所述本領(lǐng)域已知的方法例如在Southern, J. Mol. Biol. ,98 :503(1975)或 Berent 等人,Biotech. 3 :208(1985)中所述的。生物物理特性本發(fā)明還包括集合以及制備這些集合的方法,在這些集合中VH/VL類對(duì)具有令人期望的生物物理特性。有利的和期望的生物物理特性包括較高的穩(wěn)定性、較高的表達(dá)水平和低的聚集傾向。適合的生物物理特性便于在不同的階段利用集合。例如,如果抗體或其片段是可溶的并且不聚集,且被很好地表達(dá)在篩選背景如噬菌體中,那么有利于集合的篩選。以下特性使得諸如用于動(dòng)物試驗(yàn)和治療用途的抗體的隨后開(kāi)發(fā)變得容易諸如抗體可溶性、熱穩(wěn)定性、高水平表達(dá)(尤其是作為IgG在哺乳動(dòng)物中的高水平表達(dá))和低免疫原性。為了確保全部或至少大多數(shù)的抗體或其片段具有這些有利的生物物理特性,可提前篩選VH/VL類對(duì)以鑒定哪些類對(duì)顯示這些特性中的哪些。然后通過(guò)合成只編碼那些具有這類有利的生物物理特性的抗體的核酸來(lái)構(gòu)建文庫(kù)。當(dāng)然,不是所有的VH/VL類對(duì)都將以相同的程度顯示所有的生物物理特性,并且技術(shù)人員將在確定要合成哪些VH/VL類對(duì)之前確定哪些特性是更相關(guān)的和/或每種特性的平衡。因而,在某些方面,本發(fā)明提供了選擇被有效地展示諸如在噬菌體表面上或在其他展示技術(shù)中的VH/VL組合的合成抗體文庫(kù)。優(yōu)選地全部、基本上全部或?qū)嵸|(zhì)上全部的VH/ VL組合被有效的展示。展示效率可通過(guò)如在本發(fā)明中所述的噬菌體夾心ELISA測(cè)量。在其他方面,本發(fā)明提供了選擇被以Fab形式很好地表達(dá)在大腸桿菌中的VH-VL 組合的合成抗體文庫(kù)。優(yōu)選地全部、基本上全部或?qū)嵸|(zhì)上全部的VH/VL組合被以Fab形式很好地表達(dá)在大腸桿菌中。在大腸桿菌中以Fab形式的表達(dá)可被定量且在細(xì)菌培養(yǎng)物中優(yōu)選為多于ang/L、多于5mg/L、多于10mg/L或多于15mg/L。在某些方面,所有的VH-VL以多于2mg/L表達(dá),基本上所有的VH-VL組合以多于5mg/L的水平表達(dá),大部分VH-VL組合以多于10mg/L的水平在細(xì)菌培養(yǎng)物中表達(dá),和/或至少兩個(gè)、至少三個(gè)、至少四個(gè)或至少五個(gè) VH-VL組合以多于15mg/L的水平在細(xì)菌培養(yǎng)物中表達(dá)。在某些方面,本發(fā)明提供了選擇被以Fab形式很好地表達(dá)在哺乳動(dòng)物系統(tǒng)中的 VH-VL組合的合成抗體文庫(kù)。目前市售的絕大多數(shù)基于抗體的治療性生物制品為IgG形式是因?yàn)槎喾N原因(i)由于IgG與新生兒受體(Fcfoi)的相互作用,IgG分子在人體內(nèi)的半衰期非常高(約3周);(ii) IgG分子是高度可溶的、熱力學(xué)穩(wěn)定的且對(duì)血液中的蛋白酶是相對(duì)耐受的;和(iii) IgG具有清除腫瘤細(xì)胞所需的ADCC(抗體依賴性細(xì)胞介導(dǎo)的細(xì)胞毒作用)和/或CDC(補(bǔ)體依賴性細(xì)胞毒作用)活性。Fab形式的特定VL/VH組合的表達(dá)不一定與IgG形式的相同的VL/VH組合的表達(dá)相關(guān),所以IgG形式的VL/VL組合的表達(dá)和可溶性也是重要的獨(dú)立因素。哺乳動(dòng)物系統(tǒng)可包括,例如,哺乳動(dòng)物懸浮培養(yǎng)、哺乳動(dòng)物粘附細(xì)胞培養(yǎng)、HKBll細(xì)胞、PERC. 6細(xì)胞或CHO細(xì)胞。優(yōu)選地全部、基本上全部或?qū)嵸|(zhì)上全部的VH/VL組合被以IgG 形式很好地表達(dá)在哺乳動(dòng)物系統(tǒng)中。在某些方面本發(fā)明提供了合成的人抗體文庫(kù),其中所有的VH-VL組合以多于10mg/L的水平以IgG形式被表達(dá)在哺乳動(dòng)物系統(tǒng)中,其中基本上全部的VH-VL組合以多于15mg/L的水平以IgG形式被表達(dá)在哺乳動(dòng)物系統(tǒng)中;其中大多數(shù) VH-VL組合以多于20mg/L的水平以IgG形式被表達(dá)在哺乳動(dòng)物系統(tǒng)中;和/或至少三種、 至少四種或至少五種VH-VL組合以多于25mg/L的水平以IgG形式被表達(dá)在哺乳動(dòng)物系統(tǒng)中。在某些方面,本發(fā)明提供了選擇熱穩(wěn)定的VH/VL組合的合成抗體文庫(kù)。優(yōu)選地全部、基本上全部或?qū)嵸|(zhì)上全部的組合是熱穩(wěn)定的,具有至少681、701、721、741或761 的Tm??梢匀绫疚乃鰷y(cè)量熱穩(wěn)定性。在某些方面,本發(fā)明提供了合成的人抗體文庫(kù),其中基本上全部的VH-VL組合具有多于68°C的Tm ;基本上全部的VH-VL組合具有多于70°C的 Tm,或多于72°C的Tm ;大多數(shù)VH-VL組合具有多于74°C的Tm ;和/或許多VH-VL組合具有多于76°C的Tm。在某些方面,至少三種、至少四種或至少五種VH-VL組合具有多于70°C的 Tm。在某些方面,本發(fā)明提供了選擇可溶(即不趨向于聚集)的VH-VL組合的合成抗體文庫(kù)。可以通過(guò)如下方式確定可溶性例如,通過(guò)測(cè)試的Fab在細(xì)菌宿主或IgGl在真核宿主中良好的折疊和表達(dá)特征或在純化后通過(guò)分析性尺寸排阻色譜而確定的聚集。低免疫原性可被預(yù)測(cè)或通過(guò)本領(lǐng)域已知的方法直接測(cè)試,但也可以通過(guò)以下事實(shí)推斷給定VH/VL類對(duì)在文庫(kù)中是最豐富的并且使用的蛋白序列是基本上的種系蛋白序列。如本文所述,抗體序列數(shù)據(jù)可以從B細(xì)胞獲得,例如,幼稚B細(xì)胞、公開(kāi)可用的數(shù)據(jù)庫(kù)和/或文獻(xiàn)??蓪⒚總€(gè)抗體序列與最接近的種系家族和/或基因比對(duì)。從這個(gè)數(shù)據(jù),人們能夠確定豐富的VH和VL種系家族和/或基因和/或VH/VL類對(duì)。確定豐富的VH和VL種系家族和/或基因和/或VH/VL類對(duì)后,人們能夠選擇測(cè)試哪些VH和VL種系家族和/或基因和/或VH/VL類對(duì)的有利的生物物理特性。一種方法是根據(jù)豐度將VH和VL種系家族和/或基因排序,然后測(cè)試最豐富的VH和VL種系家族和 /或基因,例如前20最豐富的VH和VL種系家族和/或基因。此外,人們可以組合前20種最豐富的VH和VL種系家族和/或基因,產(chǎn)生例如400個(gè)VH和VL的組合,并測(cè)試它們的有利的生物物理特性。另外或補(bǔ)充地,人們能夠測(cè)試最豐富的VH/VL類對(duì)的有利的生物物理特性。有利的生物物理特性包括但不限于⑴它們以Fab形式被很好地展示在噬菌體上;(ii)它們以IgG形式被很好地展示在哺乳動(dòng)物細(xì)胞上;(iii)它們以Fab形式被大量表達(dá)在例如大腸桿菌中,以及以IgG形式被大量表達(dá)在例如哺乳動(dòng)物細(xì)胞中;(iv)是熱力學(xué)穩(wěn)定的;(ν)具有高血清穩(wěn)定性;(vi)具有低聚集傾向(即高可溶性);和(vii)具有低免疫原性風(fēng)險(xiǎn)。在一些方面,本發(fā)明包括編碼如下抗體或其片段的合成核酸的集合所述抗體或其片段包含以至少0. 5 %的VH和VL類對(duì)的濃度存在于至少1 X IO5個(gè)B細(xì)胞的樣品中的VH 和VL類對(duì)。在一些實(shí)施方案中,VH和VL類對(duì)以至少的VH和VL類對(duì)的濃度存在于至少I(mǎi)XlO5個(gè)B細(xì)胞的樣品中。在一些實(shí)施方案中,VH和VL類對(duì)以至少2%的VH和VL類對(duì)的濃度存在于至少I(mǎi)XlO5個(gè)B細(xì)胞的樣品中。在一些實(shí)施方案中,B細(xì)胞分離自人宿主。 在一些實(shí)施方案中,B細(xì)胞是幼稚的。在一些方面,集合包括編碼包含種系VH和VL構(gòu)架區(qū)的抗體或其片段的核酸。在一些實(shí)施方案中,集合包括至少I(mǎi)X IO4種核酸序列、至少I(mǎi)X IO6 種核酸序列、至少1 X IO8種核酸序列、至少1 X IOltl種核酸序列、或至少1 X IO11種核酸序列。在一些方面,本發(fā)明包括包含如下序列數(shù)據(jù)的試劑盒,所述序列數(shù)據(jù)闡述編碼如下抗體或其片段的核酸所述抗體或其片段包含在至少I(mǎi)XlO5個(gè)幼稚的人B細(xì)胞的樣品中存在的核酸,其中所述序列數(shù)據(jù)在可讀介質(zhì)上。在一些實(shí)施方案中,本發(fā)明包括編碼抗體或其功能片段的核酸的集合。在一些實(shí)施方案中,載體是噬菌體展示載體。在一些實(shí)施方案中,載體是噬菌粒載體。在一些方面,本發(fā)明包括用集合載體轉(zhuǎn)化的宿主細(xì)胞,所述集合載體包括編碼抗體或其功能片段的核酸的集合。在一些實(shí)施方案中,宿主細(xì)胞是原核的。在一些實(shí)施方案中,宿主細(xì)胞是大腸桿菌。在一些實(shí)施方案中,宿主細(xì)胞是真核的。在一些實(shí)施方案中,宿主細(xì)胞是哺乳動(dòng)物細(xì)胞。在一些方面,本發(fā)明包括生產(chǎn)編碼抗體或其片段的合成核酸的集合的方法,所述方法包括合成編碼如下抗體或其片段的核酸的集合所述抗體或其片段包含以至少 0. 5%的VH和VL類對(duì)的濃度存在于至少1 X IO5個(gè)B細(xì)胞的樣品中的VH和VL類對(duì)。在一些實(shí)施方案中,B細(xì)胞分離自人宿主。在一些實(shí)施方案中,B細(xì)胞是幼稚的。在一些實(shí)施方案中,通過(guò)包括如下步驟的方法鑒定存在于至少1 X IO5個(gè)B細(xì)胞的樣品中的VH和VL類對(duì)aa)從一個(gè)或更多個(gè)人宿主中收獲幼稚B細(xì)胞;ab)從步驟aa)中收獲的B細(xì)胞分離DNA ;和ac)分析在步驟ab)中分離的DNA。在一些實(shí)施方案中,分析DNA的步驟包括對(duì)DNA測(cè)序。在一些實(shí)施方案中,分析DNA 的步驟還包括鑒定每個(gè)VH和VL類對(duì)存在于樣品中的頻率。在一些實(shí)施方案中,這些方法還包括將核酸插入到載體的集合中。在一些實(shí)施方案中,載體是表達(dá)載體。在一些實(shí)施方案中,載體是展示載體。在一些實(shí)施方案中,展示載體是噬菌粒載體。在一些實(shí)施方案中, 所述方法還包括將所述載體轉(zhuǎn)染到適合的宿主細(xì)胞中。在一些實(shí)施方案中,宿主細(xì)胞是原核的。在一些實(shí)施方案中,宿主細(xì)胞是大腸桿菌。在一些實(shí)施方案中,宿主細(xì)胞是真核的。 在一些實(shí)施方案中,宿主細(xì)胞是哺乳動(dòng)物細(xì)胞。在一些方面,本發(fā)明包括鑒定對(duì)免疫原特異的抗體或其抗體片段的方法,所述方法包括如下步驟a)合成編碼如下抗體或其片段的核酸的集合所述抗體或其片段包含以至少0. 5%的VH和VL類對(duì)的濃度存在于至少1 X IO5個(gè)B細(xì)胞的樣品中的VH和VL類對(duì); b)針對(duì)特定免疫原篩選該集合;和c)篩選對(duì)所述免疫原特異的一種或更多種抗體或其片段。在一些實(shí)施方案中,B細(xì)胞分離自人宿主。在一些實(shí)施方案中,B細(xì)胞是幼稚的。在一些實(shí)施方案中,通過(guò)包括如下步驟的方法鑒定存在于至少1 X IO5個(gè)B細(xì)胞的樣品中的VH和 VL類對(duì)aa)從一個(gè)或更多個(gè)人宿主中收獲幼稚B細(xì)胞;ab)從步驟aa)中收獲的B細(xì)胞分離DNA ;和ac)分析在步驟ab)中分離的DNA。在一些實(shí)施方案中,分析DNA的步驟包括對(duì)DNA測(cè)序。在一些實(shí)施方案中,分析 DNA的步驟還包括鑒定每個(gè)VH和VL類對(duì)存在于樣品中的頻率。在一些實(shí)施方案中,合成集合的步驟還包括將所述核酸插入到載體的集合中。在一些實(shí)施方案中,所述方法還包括將所述載體轉(zhuǎn)染到適合的宿主細(xì)胞中。在一些實(shí)施方案中,所述方法還包括展示所述集合。
實(shí)施例棚列1甚應(yīng)言辦卿AtfT辦歹_立神種限吿丨瞧搬,點(diǎn)避系FRl區(qū)一方面,本公開(kāi)內(nèi)容描述了包括含種系蛋白序列的構(gòu)架區(qū)特別是FRl的抗體的集合。預(yù)期具有種系序列將降低抗體在施用于人時(shí)的免疫原性風(fēng)險(xiǎn)。然而,必須使用相容的限制酶切位點(diǎn)以使得能將編碼抗體集合的核酸標(biāo)準(zhǔn)地克隆到展示載體和/或表達(dá)載體中, 以便可針對(duì)免疫原篩選抗體。過(guò)去,用于克隆的限制酶切位點(diǎn)通常位于構(gòu)架區(qū)內(nèi),從而修飾核酸和/或氨基酸序列遠(yuǎn)離種系。為了確保本公開(kāi)內(nèi)容的每種抗體的至少構(gòu)架I(FRl)區(qū)保持種系蛋白序列,在FRl內(nèi)應(yīng)該沒(méi)有任何非天然存在的限制酶切位點(diǎn)。因此,本公開(kāi)內(nèi)容的一個(gè)方面是在原核信號(hào)序列和人前導(dǎo)序列的C端內(nèi)具體是在三個(gè)C端殘基內(nèi)摻入相同的或至少相容的限制酶切位點(diǎn)。另外,包含相同的或相容的限制酶切位點(diǎn)的信號(hào)序列和前導(dǎo)序列必須是有功能的并且容許抗體或其片段在原核和哺乳動(dòng)物表達(dá)系統(tǒng)中均有良好的展示和表達(dá)水平。^MM 1. 1 在大腸桿菌信號(hào)序歹Il的C端豐富的某的分析以下描述了要摻入信號(hào)序列大腸桿菌ompA和phoA的C端中的限制酶切位點(diǎn)的選擇和得到的信號(hào)序列的功能性的評(píng)估。第一步,分析在信號(hào)序列的C端三個(gè)氨基酸(_3到-1)處的常見(jiàn)氨基酸殘基,并且產(chǎn)生如表1所示的共有序列。見(jiàn)Chou等人,Prediction of protein signal sequences (蛋白信號(hào)序列的預(yù)測(cè)),Protein Pept. Sci. 3(6) =615-22(2002 年 12 月)。信號(hào)序列的三個(gè)C端氨基酸的共有序列-3-2-1ALASAGVSST Q在-3位,主要觀察到A、S、V和T氨基酸。在_2位,主要觀察到L、A、S和Q氨基酸。在-1位,主要觀察到A、G和S。棚列1.2:(DhoA) _吿丨瞧爐在比較表1中所示的共有序列與已知限制酶切位點(diǎn)后,選擇以下三個(gè)限制酶切位點(diǎn)AflII、NheI和AvrII用于摻入到phoA C端中并隨后研究其表達(dá)水平。重要的是注意到哪些情況下將野生型核苷酸序列改變成修飾的核苷酸序列氨基酸序列也被改變。選擇的限制酶切位點(diǎn)的核酸序列和對(duì)應(yīng)的氨基酸序列顯示在表2中。表2 AflllVLS
GTC TTA AGY
NhelVLA
GTG CTA GCN
AvrllVLG
GTC CTA GGN作為對(duì)照,研究野生型phoA信號(hào)序列的表達(dá)水平。包括3個(gè)C端序列的野生型 PhoA信號(hào)序列的核酸和氨基酸序列顯示在表3中。表3 野生型大腸桿菌phoA信號(hào)序列(從-3位到-1位的C端氨基酸序列是沒(méi)有限制酶切位點(diǎn)的TKA)MKQSTIALALLPLLFTPVTKAATGAAACAGAGCACCATTGCCCTGGCCCTGCTGCCGCTGCTGTTTACCCCAGTGACCAAAGCCPhoA 野生型 C 端 TKAACC AAA GCC為了評(píng)估表達(dá)水平,將表2中所示的限制酶切位點(diǎn)摻入到phoA信號(hào)序列中,從而還修飾了野生型氨基酸序列。得到的信號(hào)序列用來(lái)表達(dá)包含a)VH3-23或b)VHl_69種系蛋白序列的Fab片段。選擇這些種系序列因?yàn)樗鼈円阎欠€(wěn)定的并且被很好地表達(dá)。將 4D5抗體的CDR-H3 (WG⑶GFYAMDY)摻入到VH3-23和VH1-69種系基因序列中,并且JH4種系基因序列用于FR4。4D5抗體被公開(kāi)在(PDB條目IFVC ;Carter, P.,Presta, L.,Gorman, C. Μ. , Ridgway, J. B. , Henner, D. , Wong, W. L.等人(1992) ; Humani ζ at ion Biophysical Properties of Human Antibody Domains551 of an anti-p 185HER2 antibody for human cancer therapy (用于人癌癥治療的抗pl85HER2抗體的人抗體結(jié)構(gòu)域551的人源化生物物理特性)· Proc. Natl Acad. Sci. USA, 89,4285-4289 中。產(chǎn)生基于 pMORPHXll (示于圖 50)的質(zhì)粒,所示質(zhì)粒包括a)包含表2的C端限制酶切位點(diǎn)和氨基酸序列的phoA信號(hào)序列,b) VH3-23和VH1-69的VH序列,該VH序列如以上所示摻入了 CDR-H3和JH4,和c)來(lái)自 M0R03207的穩(wěn)定的且很好地表達(dá)的輕鏈。在Geneart (Regensburg,Germany)產(chǎn)生了所有的基因。通過(guò)在周質(zhì)提取后進(jìn)行抗Fd ELISA來(lái)檢查表達(dá)和周質(zhì)運(yùn)輸。在周質(zhì)提取后使用 BBS緩沖液的抗Fd表達(dá)ELISA的結(jié)果顯示在圖1中。如所示的,在VH3-23組中,包括C端限制酶切位點(diǎn)AfIII (VLS)、NheI (VLA)和AvrII (VLG)的信號(hào)序列保持在野生型(TKA)范圍內(nèi)的表達(dá)水平,其中NheI(VLA)比野生型(TKA)表現(xiàn)得更好。另外,在搖瓶中過(guò)夜培養(yǎng)后進(jìn)行大腸桿菌中的Fab表達(dá),并且在通過(guò)親和色譜和緩沖液更換的Fab純化后確定了 Fab生產(chǎn)水平。結(jié)果顯示在表4中。表 4 使用包括C端限制酶切位點(diǎn)AfIII (VLS) ,NheI (VLA)和AvrII (VLG)的信號(hào)序列相比于野生型(TKA)的Fab表達(dá)
66Fab構(gòu)建體表達(dá)率(mg/L)
VH3-23 TKA11.0
VH3-23 VLS2.0
VH3-23 VLA11.0VH3-23 VLG9.0
VHl-69 TKA7.5
VH1-69 VLS5.0
VHl-69 VLA2.5
VH1-69 VLG3.5如所示的,包括C端限制酶切位點(diǎn)AfIII (VLS)、NheI (VLA)和AvrII (VLG)的信號(hào)序列相比于野生型(TKA)表達(dá)相似量的Fab?;谝陨蠑?shù)據(jù),選擇NheI (VLA)限制酶切位點(diǎn)摻入到重鏈信號(hào)序列(phoA)中。修飾的NheI (VLA) phoA信號(hào)序列的核酸和氨基酸序列顯示在表5中。^ 5具有C端VLA和NheI限制酶切位點(diǎn)(=GCTAGC)的修飾的大腸桿菌phoA信號(hào)序列MKQSTIALALLPLLFTPVVLAATGAAACAGAGCACCATTGCCCTGGCCCTGCTGCCGCTGCTGTTTACCCCAGTGGTGCTAGCC實(shí)施例1.3 用于κ和λ輕鏈大腸桿菌信號(hào)序列(ompA)的限制酶切位點(diǎn)的選擇與實(shí)施例1. 2中所述相似的方法用于選擇摻入到κ和λ的輕鏈信號(hào)序列(ompA) 的C端中的限制酶切位點(diǎn)。在比較表1中所示的共有序列與已知的限制酶切位點(diǎn)后,選擇以下限制酶切位點(diǎn)NdeI (AYG)、NdeI (AYA)和BsiWI (TYA)摻入到ompA C端,從而還修飾該氨基酸序列,隨后研究其表達(dá)水平。選擇的限制酶切位點(diǎn)的序列顯示在表6中。表 6
NdelAYG
GCA TAT GGN
NdelAYA
GCA TAT GCN
BsiWITYA
ACG TAC GCN作為對(duì)照,研究野生型ompA信號(hào)序列的表達(dá)水平。包括3個(gè)C端序列的野生型 ompA信號(hào)序列的核酸和氨基酸序列顯示在表7中。表7 野生型大腸桿菌ompA信號(hào)序列(從_3位到_1位的C端氨基酸序列是沒(méi)有限制酶切位點(diǎn)的AQA)
MKKTAIAIAVALAGFATVAQAATGAAAAAAACCGCCATTGCCATTGCCGTGGCCCTGGCAGGCTTTGCCACCGTGGCGCAGGCCOmp 野生型 C 端 A Q AGCG CAG GCC為了評(píng)估表達(dá)水平,將表6中所示的限制酶切位點(diǎn)摻入ompA信號(hào)序列中。得到的修飾的信號(hào)序列用于表達(dá)Fab片段,所述Fab片段包括a) κ 1012 (IGKV1-39),b) k3L6(IGKV3-11),或c) λ Vl-13 (IGLV1-40)種系基因序列。選擇這些種系序列因?yàn)樗鼈円阎欠€(wěn)定的并且被很好地表達(dá)。在a) κ 1012(IGKVl-39)和b) κ 3L6 (IGKV3-11) 中,摻入了 CDR-L3 區(qū)QQHYTTPPT(對(duì)于 κ ),在 c) λ 1 Vl-13 (IGLV1-40)中,摻入了 CDR-L3區(qū)QSYDSSLSGVV (對(duì)于λ ),并且在a) -c)中,Jkl種系基因序列用作κ輕鏈的FR4;并且J12/3種系基因序列用作λ輕鏈的FR4。產(chǎn)生了 pMORPHXll (圖50中所示)質(zhì)粒,其包括a)包含表6的C端限制酶切位點(diǎn)的ompA信號(hào)序列,b)VL種系序列 κ 1012(IGKVl-39)、b) κ 3L6 (IGKV3-11)或 c) λ 1V1-13 (IGLV1-40),該 VL 種系序列如上所述摻入了⑶R-L3和FR4,以及c)在實(shí)施例1. 2中所述的為重鏈的IGHVH3-23TKA構(gòu)建體。 在 Geneart (Regensburg, Germany)產(chǎn)生了所有的基因。通過(guò)進(jìn)行在大腸桿菌中的過(guò)夜Fab生產(chǎn)、周質(zhì)提取、和周質(zhì)提取后的抗Fd ELISA, 檢查了表達(dá)和周質(zhì)運(yùn)輸。在周質(zhì)提取后使用BBS緩沖液的抗Fd表達(dá)ELISA的結(jié)果顯示在圖2中。如所示的,包括NdeI (AYA)的信號(hào)序列顯示與野生型(AQA) —樣好或更好的表達(dá)。另外,在搖瓶中過(guò)夜培養(yǎng)后進(jìn)行大腸桿菌中的Fab表達(dá),并且在通過(guò)親和色譜和緩沖液更換的Fab純化后確定了 Fab生產(chǎn)水平。結(jié)果顯示在表8中。表 8 使用與野生型(AQA)相比包括C端限制酶切位點(diǎn)NdeI (AYA)的信號(hào)序列的Fab表達(dá)。
構(gòu)建體表達(dá)率(mg/L)
VK1-39 AQA8.5
VK1-39 AYA5.5VK3-11 AQA7.0
VK3-11AYA9.5
VL1-40 AQA5.0
VL1-40 AYA5.0基于以上數(shù)據(jù),選擇NdeI (AYA)限制酶切位點(diǎn)摻入到κ和λ信號(hào)序列(ompA)中。 修飾的NdeI (AYA) ompA信號(hào)序列的核酸和氨基酸序列顯示在表9中。^ 9具有C端AYA和NdeI限制酶切位點(diǎn)(=CATATG)的修飾的大腸桿菌ompA信號(hào)序列MKKTAIAIAVALAGFATVAYAATGAAAAAAACCGCCATTGCCATTGCCGTGGCCCTGGCAGGCTTTGCCACCGTGGCATATGCC實(shí)施例1. 4 在噬菌體展示中Fab片段被信號(hào)序列展示的效率的評(píng)估
如實(shí)施例1. 2和1. 3中所述,選擇以下限制酶切位點(diǎn)摻入到Fab信號(hào)序列和IgG 前導(dǎo)序列的C端重鏈可變區(qū)(phoA和重鏈前導(dǎo)序列):NheI (VLA)輕鏈可變區(qū)(κ和λ) (ompA禾口 κ前導(dǎo)序列)Nde I (AYA)圖3顯示選擇的限制酶切位點(diǎn)和對(duì)應(yīng)的氨基酸序列。為了顯示這些修飾的信號(hào)序列介導(dǎo)Fab片段的有效運(yùn)輸和生產(chǎn),產(chǎn)生了摻入選擇的信號(hào)序列到三順?lè)醋诱故据d體中的載體構(gòu)建體,該載體構(gòu)建體編碼VH、VL和pill (用于噬菌體展示的噬菌體外殼蛋白ρΙΠ)。這樣做是為了證實(shí)包含所選的信號(hào)序列的這些載體能夠提供有用的噬菌體展示率。產(chǎn)生了 PJPdl (圖48所示)三順?lè)醋虞d體構(gòu)建體,其包含VH3-23或VH1-69種系基因的VH,或VL1-40、VK3-11、或VK1-39種系基因的VL,以及選擇的重鏈(PhoA)限制酶切位點(diǎn)NheI (VLA),且野生型phoA(TKA)作為對(duì)照,或選擇的輕鏈 (ompA)限制酶切位點(diǎn)NdeI (AYA),且野生型ompA(AQA)作為對(duì)照。此外,產(chǎn)生了包含相同組分的pM0RPH30(圖51所示)三順?lè)醋虞d體構(gòu)建體作為對(duì)照。相對(duì)展示率顯示在表10中。表10
權(quán)利要求
1.合成抗體或其功能片段的集合,所述合成抗體或其功能片段包含可變重鏈構(gòu)架區(qū)和可變輕鏈構(gòu)架區(qū),其中所述可變重鏈構(gòu)架區(qū)和所述可變輕鏈構(gòu)架區(qū)包含種系蛋白對(duì)的種系蛋白序列, 其中所述種系蛋白對(duì)包含如下特性i)以Fab形式的相對(duì)展示率包括在采樣的前75%Fab中的值;ii)與FabVH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性; ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在血清中的穩(wěn)定性;其中所述抗體或其功能片段的集合包括至少兩個(gè)不同的種系蛋白對(duì)的種系蛋白序列,并且其中所述種系蛋白對(duì)由種系基因?qū)幋a。
2.根據(jù)權(quán)利要求1所述的集合,其中所述可變重鏈構(gòu)架區(qū)和所述可變輕鏈構(gòu)架區(qū)基本上由包含如下特性的種系蛋白對(duì)的種系蛋白序列組成i)以Fab形式的相對(duì)展示率包括在采樣的前75%Fab中的值;ii)與FabVH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性; ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。
3.根據(jù)權(quán)利要求1或2所述的集合,其中所述可變重鏈構(gòu)架區(qū)和所述可變輕鏈構(gòu)架區(qū)由包含如下特性的種系蛋白對(duì)的種系蛋白序列組成i)以Fab形式的相對(duì)展示率包括在采樣的前75%Fab中的值;ii)與FabVH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性; ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。
4.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述種系基因?qū)σ灾辽?.05%的濃度存在于人免疫組庫(kù)中。
5.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述種系基因?qū)σ灾辽?.23%的濃度存在于人免疫組庫(kù)中。
6.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述種系基因?qū)σ灾辽?.51%的濃度存在于人免疫組庫(kù)中。
7.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述種系基因?qū)σ灾辽?.07%的濃度存在于幼稚的人免疫組庫(kù)中。
8.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述種系基因?qū)σ灾辽?.52%的濃度存在于幼稚的人免疫組庫(kù)中。
9.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述種系基因?qū)σ灾辽?.88%的濃度存在于幼稚的人免疫組庫(kù)中。
10.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述抗體或其功能片段包括人序列。
11.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述抗體或其功能片段的集合包括至少十七個(gè)不同的種系蛋白對(duì)的種系蛋白序列。
12.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述抗體或其功能片段包括含種系蛋白序列的一個(gè)或更多個(gè)互補(bǔ)決定區(qū)。
13.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述抗體或其功能片段包括含種系蛋白序歹丨J的FRl區(qū)、CDRl區(qū)、FR2區(qū)、CDR2區(qū)和FR3區(qū)。
14.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述抗體或其功能片段包括選自由以下組成的組的FR4區(qū)JH4、J κ 1禾口 J λ 2/3。
15.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述抗體或其功能片段包括多樣化的HCDR3區(qū)。
16.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述抗體或其功能片段包括多樣化的LCDR3區(qū)。
17.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述集合包括IXIO4種抗體或其功能片段。
18.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述種系蛋白對(duì)包括包含在采樣的前60% Fab中的值的以Fab形式的相對(duì)展示率。
19.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述種系蛋白對(duì)包括與Fab VH1-69VLA_V11-40AYA相比至少0. 6的以Fab形式的表達(dá)水平。
20.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述種系蛋白對(duì)包括以Fab形式在 70°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性。
21.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述種系蛋白對(duì)包括與M0R03080相比至少0. 6的以IgG形式的表達(dá)水平。
22.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述可變重鏈構(gòu)架區(qū)和所述可變輕鏈構(gòu)架區(qū)包括選自由以下組成的組的種系蛋白對(duì)的種系蛋白序列IGHV3-23/ IGKV1-5 ;IGHV3-23/IGKV3-20 ;IGHV4-39/IGKV3-15 ;IGHV3-23/IGKV3-15 ;IGHV4-39/ IGKV1-39/1D-39 ; IGHV1-18/IGKV3-20 ; IGHV3-30/IGKV3-20 ; IGHV4-39/IGKV1-5 ; IGHV1-69/IGKV1-39/1D-39 ; IGHV5-51/IGLV1-40 ; IGHV4-39/IGKV3-20 ; IGHV3-23/ IGLV2-14 ; IGHV4-39/IGLV 3-21 ; IGHV3-23/IGKV1-39/1D-39 ; IGHV3-30/IGKV1-39/1D-39 ; IGHV1-69/IGKV3-20 ;IGHV3-48/IGKV3-20 ;IGHV1-2/IGKV3-20 ;IGHV3-30/IGKV4-1 ; IGHV5-51/IGLV 2-14 ; IGHV5-51/IGKV3-20 ; IGHV3-7/IGKV1-39/1D-39 ; IGHV3-7/ IGKV1-5 ;IGHV3-15/IGKV3-20 ;IGHV4-39/IGLV2-14 ;IGHV3-23/IGKV3-11 ;IGHV3-30/ IGKV1-5 ;IGHV3-30/IGKV3-15 ; IGHV3-21/IGKV1-5 ; IGHV3-21/IGKV3-15 ; IGHV3-30/IGLV 1-51 ;IGHV3-21/IGLV 1-51 ;和 IGHV1-69/IGKV3-11。
23.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合,其中所述抗體的所述功能片段選自由 Fab、F (ab ‘ ) 2、Fab,、Fv 禾口 scFv 組成的組。
24.編碼根據(jù)前述權(quán)利要求中任一項(xiàng)所述的集合的核酸的集合。
25.—種載體,所述載體包含權(quán)利要求M所述的核酸。
26.一種重組宿主細(xì)胞,所述重組宿主細(xì)胞包含權(quán)利要求M所述的核酸或權(quán)利要求25 所述的載體。
27.如權(quán)利要求沈所述的重組宿主細(xì)胞,所述重組宿主細(xì)胞是原核的或真核的。
28.根據(jù)權(quán)利要求27所述的重組宿主細(xì)胞,所述重組宿主細(xì)胞是大腸桿菌(E.coli)或哺乳動(dòng)物細(xì)胞。
29.合成抗體或其功能片段的集合,所述合成抗體或其功能片段包含可變重鏈構(gòu)架區(qū)和可變輕鏈構(gòu)架區(qū),其中所述構(gòu)架區(qū)包括種系蛋白序列, 其中所述種系蛋白序列包含如下特性 i)在互補(bǔ)決定區(qū)中四個(gè)或更少的翻譯后修飾; )在互補(bǔ)決定區(qū)中兩個(gè)或更少的甲硫氨酸;iii)一個(gè)或更少的未成對(duì)半胱氨酸;iv)一個(gè)或更少的潛在T細(xì)胞表位; ν)中等或低的聚集傾向;和vi)至少7. 5的等電點(diǎn);且其中所述抗體或其功能片段的集合包括至少兩種不同的可變重鏈種系蛋白序列, 其中所述種系蛋白序列由種系基因序列編碼。
30.根據(jù)權(quán)利要求四所述的集合,其中所述可變重鏈種系基因序列或可變輕鏈種系基因序列以至少0. 5%的濃度存在于人免疫組庫(kù)中。
31.根據(jù)權(quán)利要求四或30所述的集合,其中所述抗體或其功能片段的集合包括至少五種不同的可變重鏈種系蛋白序列。
32.根據(jù)權(quán)利要求四-31中任一項(xiàng)所述的集合,其中所述抗體或其功能片段包括人序列。
33.根據(jù)權(quán)利要求四-32中任一項(xiàng)所述的集合,其中所述可變重鏈種系基因序列或可變輕鏈種系基因序列以至少5. 0%的濃度存在于人免疫組庫(kù)中。
34.根據(jù)權(quán)利要求四-33中任一項(xiàng)所述的集合,其中所述抗體或其功能片段包括含種系蛋白序列的一個(gè)或更多個(gè)互補(bǔ)決定區(qū)。
35.根據(jù)權(quán)利要求四-34中任一項(xiàng)所述的集合,其中所述抗體或其功能片段包括含種系蛋白序列的FRl、CDRl、FR2、CDR2和FR3。
36.根據(jù)權(quán)利要求四-35中任一項(xiàng)所述的集合,其中所述抗體或其功能片段包括選自由以下組成的組的FR4區(qū)JH4、J κ 1禾口 J λ 2/3。
37.根據(jù)權(quán)利要求四-36中任一項(xiàng)所述的集合,其中所述抗體或其功能片段還包括多樣化的HCDR3區(qū)。
38.根據(jù)權(quán)利要求四-37中任一項(xiàng)所述的集合,其中所述抗體或其功能片段還包括多樣化的IXDR3區(qū)。
39.根據(jù)權(quán)利要求四-38中任一項(xiàng)所述的集合,其中所述集合包括IXIO4種抗體或其功能片段。
40.根據(jù)權(quán)利要求四-39中任一項(xiàng)所述的集合,其中所述可變重鏈種系蛋白序列選自由以下組成的組IGHV3-23 ; IGHV3-30 ; IGHV4-39 ; IGHV4-34 ; IGHV4-59 ; IGHV1-69 ; IGHV5-51 ;IGHV3-7 ;IGHV1-18 ;IGHV3-48 ;IGHV3-15 ;IGHV3-21 ;IGHV1-2 ;IGHV3-33 ; IGHV4-31 ;IGHV3-53 ;IGHV3-11 ;IGHV3-9 ;IGHV4-4 ;IGHV1-46 ;IGHV3-74 ;IGHV1-24 ; IGHV4-61 ; IGHV1-8 ; IGHV1-3 ; IGHV3-49 ; IGHV3-43 ; IGHV4-28 ; IGHV3-64 ;禾口 IGHV7-81。
41.根據(jù)權(quán)利要求四-40中任一項(xiàng)所述的集合,其中所述可變?chǔ)瘦p鏈種系蛋白序列選自由以下組成的組 JGKV3-20 ; IGKV1-39/1D-39 ; IGKV1-5 ; IGKV3-15 ; IGKV4-1 ; IGKV3-11 ; IGKV2-28/2D-28 ; IGKV1-33/1D-33 ; IGKV2-30 ; IGKV1-9 ;IGKV1-17 ; IGKV1-27 ; IGKV1-8 ; IGKV1-16 ; IGKV1-6 ;IGKV1-12 ; IGKV2D-29 ;IGKV1-13 ; IGKV1D-8 ;和 IGKV2-24。
42.根據(jù)權(quán)利要求四-41中任一項(xiàng)所述的集合,其中所述可變?chǔ)溯p鏈種系蛋白序列選自由以下組成的組 JGLV2-14 ;IGLV1-40 ;IGLV1-44 ;IGLV1-51 ;IGLV2-23 ;IGLV3-21 ; IGLV1-47 ;IGLV3-1 ;IGLV2-11 ; IGLV2-8 ; IGLV6-57 ; IGLV3-25 ; IGLV7-46 ;IGLV1-36 ; IGLV7-43 ; IGLV9-49 ; IGLV4-69 ; IGLV2-18 ; IGLV3-10 ;和 IGLV3-27。
43.一種生產(chǎn)根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的合成抗體或其功能片段的集合的方法。
44.根據(jù)權(quán)利要求43所述的方法,其中所述生產(chǎn)的步驟還包括產(chǎn)生含可變重鏈構(gòu)架區(qū)和可變輕鏈構(gòu)架區(qū)的抗體或其功能片段的集合,其中所述可變重鏈構(gòu)架區(qū)和所述可變輕鏈構(gòu)架區(qū)包含種系蛋白對(duì)的種系蛋白序列, 其中所述種系蛋白對(duì)包含如下特性i)以Fab形式的相對(duì)展示率包括在采樣的前75%Fab中的值;ii)與FabVH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性; ν)與M0R03080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性;且其中所述抗體或其功能片段的集合包括至少兩個(gè)不同的種系蛋白對(duì)。
45.根據(jù)權(quán)利要求43或44所述的方法,其中所述生產(chǎn)的步驟還包括如下步驟a)獲得包括在人免疫組庫(kù)中存在的可變重鏈和可變輕鏈種系基因?qū)Φ臄?shù)據(jù);b)鑒定包含如下特性的可變重鏈和可變輕鏈種系蛋白對(duì)i)以Fab形式的相對(duì)展示率包括在采樣的前75%Fab中的值;ii)與FabpMxll_FH VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性; ν)與M0R3080相比至少0. 4的以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性;且c)產(chǎn)生包含在步驟b)中鑒定的種系蛋白對(duì)的可變重鏈種系蛋白序列和可變輕鏈種系蛋白序列的抗體或其功能片段的集合。
46.根據(jù)權(quán)利要求45所述的方法,其中步驟b)還包括如下步驟ba)鑒定以至少0. 05%的濃度存在于人免疫組庫(kù)中的可變重鏈和可變輕鏈種系基因?qū)?;bb)產(chǎn)生包含在步驟ba)中鑒定的種系蛋白對(duì)的抗體或其功能片段;和 be)評(píng)估所述種系蛋白對(duì)的如下特性i)以Fab形式的相對(duì)展示率;ii)以Fab形式的表達(dá)水平;iii)以Fab形式在60°C或更高溫度的熱穩(wěn)定性;iv)以Fab形式在37°C持續(xù)大于十天的在牛血清或小鼠血清中的穩(wěn)定性; ν)以IgG形式的表達(dá)水平;和vi)以IgG形式在37°C持續(xù)十四天的在牛血清中的穩(wěn)定性。
47.根據(jù)權(quán)利要求45或46所述的方法,其中步驟a)還包括如下步驟aa)從樣品中分離人B細(xì)胞;ab)從所述B細(xì)胞產(chǎn)生cDNA;ac)PCR擴(kuò)增來(lái)自所述B細(xì)胞的cDNA ;ad)對(duì)PCR產(chǎn)物測(cè)序;ae)鑒定每種PCR產(chǎn)物的種系基因。
48.根據(jù)權(quán)利要求43-46中任一項(xiàng)所述的方法,其中產(chǎn)生集合的所述步驟還包括如下步驟ca)合成編碼所述抗體或其功能片段的核酸;cb)將所述核酸克隆到載體中;cc)表達(dá)所述抗體或其功能片段。
49.根據(jù)權(quán)利要求43-48中任一項(xiàng)所述的方法,其中所述種系基因?qū)σ灾辽?.05%的濃度存在于人免疫組庫(kù)中。
50.根據(jù)權(quán)利要求43-49中任一項(xiàng)所述的方法,其中所述種系基因?qū)σ灾辽?.23%的濃度存在于人免疫組庫(kù)中。
51.根據(jù)權(quán)利要求43-50中任一項(xiàng)所述的方法,其中所述種系基因?qū)σ灾辽?.51%的濃度存在于人免疫組庫(kù)中。
52.根據(jù)權(quán)利要求43-51中任一項(xiàng)所述的方法,其中所述種系基因?qū)σ灾辽?.07%的濃度存在于幼稚的人免疫組庫(kù)中。
53.根據(jù)權(quán)利要求43-52中任一項(xiàng)所述的方法,其中所述種系基因?qū)σ灾辽?.52%的濃度存在于幼稚的人免疫組庫(kù)中。
54.根據(jù)權(quán)利要求43-53中任一項(xiàng)所述的方法,其中所述種系基因?qū)σ灾辽?.88%的濃度存在于幼稚的人免疫組庫(kù)中。
55.根據(jù)權(quán)利要求43-54中任一項(xiàng)所述的方法,其中所述抗體或其功能片段包括人序列。
56.根據(jù)權(quán)利要求43-55中任一項(xiàng)所述的方法,其中所述抗體或其功能片段包括至少十七個(gè)不同的種系蛋白對(duì)的種系蛋白序列。
57.根據(jù)權(quán)利要求43-56中任一項(xiàng)所述的方法,其中所述抗體或其功能片段包括含種系蛋白序列的一個(gè)或更多個(gè)互補(bǔ)決定區(qū)。
58.根據(jù)權(quán)利要求43-57中任一項(xiàng)所述的方法,其中所述抗體或其功能片段包括含種系蛋白序歹丨J的FRl、CDRl、FR2、CDR2和FR3。
59.根據(jù)權(quán)利要求43-58中任一項(xiàng)所述的方法,其中所述抗體或其功能片段包括選自由以下組成的組的FR4區(qū)JH4、J κ 1禾口 J λ 2/3。
60.根據(jù)權(quán)利要求43-59中任一項(xiàng)所述的方法,其中所述抗體或其功能片段包括多樣化的HCDR3區(qū)。
61.根據(jù)權(quán)利要求43-60中任一項(xiàng)所述的方法,其中所述抗體或其功能片段包括多樣化的IXDR3區(qū)。
62.根據(jù)權(quán)利要求43-61中任一項(xiàng)所述的方法,其中所述集合包括IXIO4種抗體或其功能片段。
63.根據(jù)權(quán)利要求43-62中任一項(xiàng)所述的方法,其中所述種系蛋白對(duì)包括包含在采樣的前60% Fab中的值的以Fab形式的相對(duì)展示率。
64.根據(jù)權(quán)利要求43-63中任一項(xiàng)所述的方法,其中所述種系蛋白對(duì)包括與Fab VH1-69VLA_V11-40AYA相比至少0. 6的以Fab形式的表達(dá)水平。
65.根據(jù)權(quán)利要求43-64中任一項(xiàng)所述的方法,其中所述種系蛋白對(duì)包括以Fab形式在 70°C或更高溫度持續(xù)至少45分鐘的熱穩(wěn)定性。
66.根據(jù)權(quán)利要求43-65中任一項(xiàng)所述的方法,其中所述種系蛋白對(duì)包括與M0R03080 相比至少0. 6的以IgG形式的表達(dá)水平。
67.根據(jù)權(quán)利要求43-66中任一項(xiàng)所述的方法,其中所述可變重鏈構(gòu)架區(qū)和所述可變輕鏈構(gòu)架區(qū)包括選自由以下組成的組的種系蛋白對(duì)的種系蛋白序列IGHV3-23/ IGKV1-5 ;IGHV3-23/IGKV3-20 ;IGHV4-39/IGKV3-15 ;IGHV3-23/IGKV3-15 ;IGHV4-59/ IGKV1-39/1D-39 ; IGHV4-39/IGKV1-39/1D-39 ; IGHV4-59/IGKV3-20 ; IGHV1-18/IGKV3-20 ; IGHV3-30/IGKV3-20 ; IGHV4-39/IGKV1-5 ; IGHV1-69/IGKV1-39/1D-39 ; IGHV5-51/ IGLV 1-40 ;IGHV3-23/IGKV4-1 ;IGHV4-39/IGKV3-20 ;IGHV3-23/IGLV 2-14 ;IGHV4-39/ IGLV 3-21 ; IGHV3-23/IGKV1-39/1D-39 ; IGHV3-30/IGKV1-39/1D-39 ; IGHV3-30/ IGKV3-11 ;IGHV1-69/IGKV3-20 ;IGHV3-48/IGKV3-20 ;IGHV1-2/IGKV3-20 ;IGHV3-30/ IGKV4-1 ;IGHV5-51/IGLV 2-14 ;IGHV4-59/IGKV4-1 ;IGHV5-51/IGKV3-20 ;IGHV3-7/ IGKV1-39/1D-39 ; IGHV3-7/IGKV1-5 ; IGHV3-15/IGKV3-20 ; IGHV4-39/IGLV 2-14 ; IGHV4-39/IGLV 2-8 ; IGHV3-23/IGKV3-11 ; IGHV3-30/IGKV1-5 ; IGHV3-30/IGKV3-15 ; IGHV3-21/IGKV1-5 ;IGHV3-21/IGKV3-15 ;IGHV3-30/IGLV1-51 ;IGHV3-21/IGLV 1-51 ; IGHV3-53/IGLV 1-44 ; IGHV4-59/IGKV3-15 ;IGHV5-51/IGKV4-1 ; IGHV1-69/IGKV4-1 ;和 IGHV1-69/IGKV3-11。
68.根據(jù)權(quán)利要求43-67中任一項(xiàng)所述的方法,其中所述抗體的所述功能片段選自由 Fab、F (ab ‘ ) 2、Fab,、Fv 和 scFv 組成的組。
69.一種分離的核酸,所述分離的核酸編碼含C端限制酶切位點(diǎn)的信號(hào)序列或前導(dǎo)序列。
70.根據(jù)權(quán)利要求69所述的核酸,其中所述限制酶切位點(diǎn)是NheI。
71.根據(jù)權(quán)利要求69或70所述的核酸,其中所述信號(hào)序列或前導(dǎo)序列包括phoA或人重鏈前導(dǎo)序列。
72.根據(jù)權(quán)利要求69所述的核酸,其中所述限制酶切位點(diǎn)是NdeI。
73.根據(jù)權(quán)利要求69或72所述的核酸,其中所述信號(hào)序列包括ompA或人κ前導(dǎo)序列。
74.一種載體,所述載體包含根據(jù)權(quán)利要求69-73中任一項(xiàng)所述的核酸。
75.一種宿主細(xì)胞,所述宿主細(xì)胞包含權(quán)利要求74所述的載體。
76.根據(jù)權(quán)利要求75所述的宿主細(xì)胞,所述宿主細(xì)胞是原核的或真核的。
77.根據(jù)權(quán)利要求75或76所述的宿主細(xì)胞,所述宿主細(xì)胞是大腸桿菌細(xì)胞。
78.根據(jù)權(quán)利要求75或76所述的宿主細(xì)胞,所述宿主細(xì)胞是哺乳動(dòng)物細(xì)胞。
79.一種分離的抗體或其功能片段,所述分離的抗體或其功能片段包括含種系蛋白對(duì)的種系蛋白序列的FRl、⑶Rl、FR2、⑶R2和FR3,其中所述種系蛋白對(duì)選自由以下組成的組IGHV3-23/IGKV1-5 ; IGHV3-23/IGKV3-20 ; IGHV4-39/IGKV3-15 ; IGHV3-23/ IGKV3-15 ; IGHV4-39/IGKV1-39/1D-39 ;IGHV1-18/IGKV3-20 ; IGHV3-30/IGKV3-20 ; IGHV4-39/IGKV1-5 ;IGHV1-69/IGKV1-39/1D-39 ;IGHV5-51/IGLV 1-40 ;IGHV4-39/ IGKV3-20 ; IGHV3-23/IGLV 2-14 ; IGHV4-39/IGLV 3-21 ; IGHV3-23/IGKV1-39/1D-39 ; IGHV3-30/IGKV1-39/1D-39 ; IGHV1-69/IGKV3-20 ; IGHV3-48/IGKV3-20 ; IGHV1-2/ IGKV3-20 ; IGHV3-30/IGKV4-1 ;IGHV5-51/IGLV 2-14 ;IGHV5-51/IGKV3-20 ;IGHV3-7/ IGKV1-39/1D-39 ;IGHV3-7/IGKV1-5 ;IGHV3-15/IGKV3-20 ;IGHV4-39/IGLV2-14 ;IGHV3-23/ IGKV3-11 ; IGHV3-30/IGKV1-5 ; IGHV3-30/IGKV3-15 ; IGHV3-21/IGKV1-5 ; IGHV3-21/ IGKV3-15 ; IGHV3-30/IGLV1-51 ; IGHV3-21/IGLV 1-51 ;和 IGHV1-69/I。
全文摘要
本公開(kāi)內(nèi)容使得鑒定人免疫組庫(kù)中的VH和VL類對(duì)、確定最普遍的VH和VL類對(duì)和具有有利的生物物理特性的VH和VL類對(duì)的方法成為可能。更具體而言,本公開(kāi)內(nèi)容的集合包括具有高度多樣化的CDR的最普遍的和/或最優(yōu)選的VH和VL類配對(duì)。
文檔編號(hào)C07K16/00GK102449149SQ201080022793
公開(kāi)日2012年5月9日 申請(qǐng)日期2010年5月29日 優(yōu)先權(quán)日2009年5月29日
發(fā)明者喬瑟夫·普拉斯勒, 塔賈·赫爾曼, 托馬斯·蒂勒, 斯特法妮·尤林格, 馬庫(kù)斯·恩澤爾伯格 申請(qǐng)人:莫佛塞斯公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1