本發(fā)明處于抗體人源化領(lǐng)域中。本文中報(bào)道了一種用于抗體人源化的方法,其包括把供體殘基移植到受體構(gòu)架上,其中根據(jù)所述的人源化的抗體和供體抗體的vh-vl域間角進(jìn)行受體構(gòu)架的選擇。
背景技術(shù):
:抗體的抗原結(jié)合位點(diǎn)是在重鏈和輕鏈可變域vh和vl的界面處形成的,使得vh-vl結(jié)構(gòu)域取向成為影響抗體特異性和親和性的因素。為了保留供體抗體性質(zhì),在抗體工程化和人源化的過程中保存vh-vl結(jié)構(gòu)域取向?qū)?huì)是有利的。預(yù)測正確的vh-vl取向已經(jīng)被認(rèn)識(shí)到是抗體同源性建模中的一個(gè)因素。在wo2011/021009中,具有改善的可制造性的變體免疫球蛋白與下列發(fā)現(xiàn)相關(guān):修飾免疫球蛋白分子的某些關(guān)鍵位置中的氨基酸序列導(dǎo)致在可制造性方面的改善,特別是導(dǎo)致聚集傾向的減小和/或生產(chǎn)水平的提高。在wo2008/003931中報(bào)道了一種用于人源化的抗體的構(gòu)架篩選的方法,由此通過考慮人受體構(gòu)架與供體序列的同源性,可能選擇最合適的可變區(qū)構(gòu)架,但是更重要地,考慮選擇其中特異性殘基是專性供體殘基的那些可變區(qū)構(gòu)架,即給予加權(quán)。因此,已經(jīng)存在于同源的人構(gòu)架中的這些加權(quán)的(重要的)供體殘基越多,所述的人構(gòu)架越合適,無論總的同源性是否稍微小于具有較少的加權(quán)殘基匹配的另一個(gè)構(gòu)架。在wo2001/027160(ep1224224)中報(bào)道了一種單克隆抗體生產(chǎn)和特異性地同時(shí)對(duì)單克隆抗體可變區(qū)的多個(gè)不同結(jié)構(gòu)域進(jìn)行體外親和性最優(yōu)化的方法。通過產(chǎn)生cdr移植的可變區(qū)片段的多樣庫,然后針對(duì)結(jié)合活性類似于或好于供體的結(jié)合活性來篩選所述的庫,來完成移植。多樣庫是通過選擇在相應(yīng)的位置處與供體構(gòu)架相比不同的受體構(gòu)架位置并且使得庫群體在那些位置中的每一個(gè)處包含所有可能的氨基酸殘基變化以及在所述的可變區(qū)的cdr內(nèi)的每一個(gè)位置處包含所有可能的氨基酸殘基變化而產(chǎn)生的。dunbar,j.等人(prot.eng.des.sel.26(2013)611-620)在表征抗體中的vh-vl取向時(shí)報(bào)道了ab角。bujotzek,a.等人(proteins:structure,function,andbioinformatics83(2015)681-695)報(bào)道了vh-vl結(jié)構(gòu)域取向的預(yù)測,用于抗體可變域建模。發(fā)明概述本文中報(bào)道了用于把抗體人源化的基于序列的快速方法,其基于重鏈和輕鏈可變域取向、vh-vl域間取向(角)的確定。采用本文中報(bào)道的方法,提供了改善的,即更快的、更經(jīng)濟(jì)的、更少資源需求的以及更有效的篩選最好的合適的非人抗體的人源化變體。更詳細(xì)地,根據(jù)本文中報(bào)道的方法使用基于序列的快速預(yù)測子,其預(yù)測vh-vl域間取向。用六個(gè)絕對(duì)ab角參數(shù)來描述所述的vh-vl取向,以把vh-vl取向的不同自由度精確地分開。已經(jīng)發(fā)現(xiàn):采用根據(jù)本文中報(bào)道的方法,可以實(shí)現(xiàn)針對(duì)變體(人源化的)抗體的vh-vl取向相對(duì)于親本(非人)抗體的偏差方面,在人源化的抗體的選擇方面的改善。這表面關(guān)于在親本(非人)和變體(人源化的)抗體之間vh-vl域間角的相似性方面的改善。與采用不同的方法得到的人源化的抗體比較,根據(jù)本文中報(bào)道的方法(包括移植方法)正在遞送變體(人源化的)抗體的較好的結(jié)合性質(zhì)??梢园哑渌こ袒椒ɡ鐦?gòu)架改組與根據(jù)本文中報(bào)道的方法組合,導(dǎo)致當(dāng)一種人構(gòu)架被交換為另一種人構(gòu)架以改變抗體的生物物理性能時(shí),所獲得的變體抗體的改善的結(jié)合。正如根據(jù)本文中報(bào)道的那樣,一個(gè)方面是用于篩選來源于親本抗體fv片段的一種或更多種變體抗體fv片段的方法,其包括下列步驟:-通過把來自親本抗體fv片段的一個(gè)或更多個(gè)決定特異性的殘基移植/轉(zhuǎn)移到受體抗體fv片段上而產(chǎn)生許多變體抗體fv片段,由此許多變體抗體fv片段中的每一個(gè)變體抗體fv片段與其它變體抗體fv片段至少有一個(gè)氨基酸殘基不同,-基于抗體fv片段的序列指紋,確定親本fv片段和許多變體抗體fv片段中的每一個(gè)變體抗體fv片段的vh-vl取向,-選擇與親本抗體的vh-vl取向比較,在vh-vl取向方面具有最小差別的那些變體抗體fv片段并且從而選擇來源于親本抗體fv片段的一種或更多種變體抗體fv片段,由此所述的一種或更多種變體抗體fv片段和親本抗體fv片段與相同的抗原結(jié)合。在一種實(shí)施方式中,所述的方法包括下列步驟:-選擇與親本抗體的vh-vl域間角比較,在vh-vl域間角方面具有最高的(結(jié)構(gòu)上的)相似度的那些變體抗體fv片段并且從而選擇來源于親本抗體fv片段的一種或更多種變體抗體fv片段。一個(gè)方面是用于篩選來源于親本抗體fv片段的一種或更多種變體抗體fv片段的方法,其包括下列步驟:-通過把來自親本抗體fv片段的一個(gè)或更多個(gè)決定特異性的殘基移植/轉(zhuǎn)移到受體抗體fv片段上而產(chǎn)生許多變體抗體fv片段,由此許多變體抗體fv片段中的每一個(gè)變體抗體fv片段與其它變體抗體fv片段至少有一個(gè)氨基酸殘基不同,-基于抗體fv片段的序列指紋,確定親本fv片段和許多變體抗體fv片段中的每一個(gè)變體抗體fv片段的vh-vl取向,-選擇與親本抗體的vh-vl域間角比較,在vh-vl域間角方面具有最高的(結(jié)構(gòu)上的)相似度的那些變體抗體fv片段并且從而選擇來源于親本抗體fv片段的一種或更多種變體抗體fv片段,由此所述的一種或更多種變體抗體fv片段和親本抗體fv片段與相同的抗原結(jié)合。在一種實(shí)施方式中,親本抗體fv片段是非人抗體fv片段。在一種實(shí)施方式中,受體抗體fv片段是人或人源化的抗體fv片段或人抗體fv片段種系氨基酸序列。正如根據(jù)本文中報(bào)道的那樣,一個(gè)方面是用于把非人抗體人源化的方法,其包括下列步驟-提供與抗原特異性地結(jié)合的非人抗體,-通過把來自非人抗體的一個(gè)或更多個(gè)決定特異性的殘基移植/轉(zhuǎn)移到人或人源化的受體抗體或種系抗體序列上而產(chǎn)生許多變體抗體,由此許多變體抗體中的每一種變體抗體與其它變體抗體至少有一個(gè)氨基酸殘基不同,-基于抗體fv片段的序列指紋,確定非人抗體的fv片段和許多變體抗體中的每一種變體抗體的fv片段的vh-vl取向,-選擇與親本抗體的vh-vl取向比較,在vh-vl取向方面具有最小差別的那些變體抗體fv片段并且從而選擇來源于非人的一種或更多種人源化的抗體,由此所述的一種或更多種人源化的抗體和非人抗體與相同的抗原結(jié)合。在一種實(shí)施方式中,所述的方法包括下列步驟:-選擇與親本抗體的vh-vl域間角比較,在vh-vl域間角方面具有最高的(結(jié)構(gòu)上的)相似度的那些變體抗體fv片段并且從而選擇來源于非人抗體的一種或更多種人源化的抗體。一個(gè)方面是用于把非人抗體人源化的方法,其包括下列步驟:-提供與抗原特異性地結(jié)合的非人抗體,-通過把來自非人抗體的一個(gè)或更多個(gè)決定特異性的殘基移植/轉(zhuǎn)移到人或人源化的受體抗體或種系抗體序列上而產(chǎn)生許多變體抗體,由此許多變體抗體中的每一種變體抗體與其它變體抗體至少有一個(gè)氨基酸殘基不同,-基于抗體fv片段的序列指紋,確定非人抗體的fv片段和許多變體抗體中的每一種變體抗體的fv片段的vh-vl取向,-選擇與親本抗體的vh-vl域間角比較,在vh-vl域間角方面具有最高的(結(jié)構(gòu)上的)相似度的那些變體抗體fv片段并且從而選擇來源于非人抗體的一種或更多種人源化的抗體,由此所述的一種或更多種人源化的抗體和非人抗體一樣與相同的抗原結(jié)合。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,所述的序列指紋是一組vh-vl界面殘基。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,vh-vl界面殘基是氨基酸殘基,其側(cè)鏈原子具有以小于或等于(在至少90%的所有重疊的fv結(jié)構(gòu)中)的距離鄰接相反鏈的原子。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,所述組的vh-vl界面殘基包括殘基l44、l46、l87、h45、h62(根據(jù)chothia指標(biāo)編號(hào))。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,所述組的vh-vl界面殘基包括殘基h35、h37、h39、h45、h47、h50、h58、h60、h61、h91、h95、h96、h98、h100x-2、h100x-1、h100x、h101、h102、h103、h105、l32、l34、l36、l38、l43、l44、l46、l49、l50、l55、l87、l89、l91、l95x-1、l95x、l96(根據(jù)chothia指標(biāo)編號(hào))。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,所述組的vh-vl界面殘基包括殘基h33、h35、h43、h44、h46、h50、h55、h56、h58、h61、h62、h89、h99、l34、l36、l38、l41、l42、l43、l44、l45、l46、l49、l50、l53、l55、l56、l85、l87、l89、l91、l93、l94/l95x-1、l95x、l96、l97、l100(根據(jù)chothia指標(biāo)編號(hào))。在本文中報(bào)告的所有方面當(dāng)中的一種實(shí)施方式中,所述組的vh-vl界面殘基包括殘基h33、h35、h37、h39、h43、h44、h45、h46、h47、h50、h55、h56、h58、h60、h61、h62、h89、h91、h95、h96、h98、h99、h100x-2、h100x-1、h100x、h101、h102、h103、h105、l32、l34、l36、l38、l41、l42、l43、l44、l45、l46、l49、l50、l53、l55、l56、l85、l87、l89、l91、l93、l94/l95x-1、l95x、l96、l97、l100(根據(jù)chothia指標(biāo)編號(hào))。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,所述組的vh-vl界面殘基包括殘基h35、h37、h39、h45、h47、h50、h58、h60、h61、h91、h95、h96、h98、h100x-2、h100x-1、h100x、h101、h102、h103、h105、l32、l34、l36、l38、l43、l44、l46、l49、l50、l55、l87、l89、l91、l95x-1、l95x、l96、l98(根據(jù)chothia指標(biāo)編號(hào))。在本文中報(bào)告的所有方面當(dāng)中的一種實(shí)施方式中,所述組的vh-vl界面殘基包括殘基h33、h35、h37、h39、h43、h44、h45、h46、h47、h50、h55、h56、h58、h60、h61、h62、h89、h91、h95、h96、h98、h99、h100x-2、h100x-1、h100x、h101、h102、h103、h105、l32、l34、l36、l38、l41、l42、l43、l44、l45、l46、l49、l50、l53、l55、l56、l85、l87、l89、l91、l93、l94/l95x-1、l95x、l96、l97、l98、l100(根據(jù)chothia指標(biāo)編號(hào))。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,所述組的vh-vl界面殘基包括殘基210、296、610、612、733(根據(jù)wolfguy指標(biāo)編號(hào))。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,所述組的vh-vl界面殘基包括殘基199、202、204、210、212、251、292、294、295、329、351、352、354、395、396、397、398、399、401、403、597、599、602、604、609、610、612、615、651、698、733、751、753、796、797、798(根據(jù)wolfguy指標(biāo)編號(hào))。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,所述組的vh-vl界面殘基包括殘基197、199、208、209、211、251、289、290、292、295、296、327、355、599、602、604、607、608、609、610、611、612、615、651、696、698、699、731、733、751、753、755、796、797、798、799、803(根據(jù)wolfguy指標(biāo)編號(hào))。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,所述組的vh-vl界面殘基包括殘基197、199、202、204、208、209、210、211、212、251、292、294、295、296、327、329、351、352、354、355、395、396、397、398、399、401、403、597、599、602、604、607、608、609、610、611、612、615、651、696、698、699、731、733、751、753、755、796、796、797、798、799、801、803(根據(jù)wolfguy指標(biāo)編號(hào))。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,所述組的vh-vl界面殘基包括殘基199、202、204、210、212、251、292、294、295、329、351、352、354、395、396、397、398、399、401、403、597、599、602、604、609、610、612、615、651、698、733、751、753、796、797、798、801(根據(jù)wolfguy指標(biāo)編號(hào))。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,所述組的vh-vl界面殘基包括殘基197、199、202、204、208、209、210、211、212、251、292、294、295、296、327、329、351、352、354、355、395、396、397、398、399、401、403、597、599、602、604、607、608、609、610、611、612、615、651、696、698、699、731、733、751、753、755、796、797、798、799、801、803(根據(jù)wolfguy指標(biāo)編號(hào))。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,關(guān)于vh-vl取向,所述的選擇/篩選基于頂部80%變體抗體fv片段。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,關(guān)于vh-vl取向,所述的選擇/篩選是基于頂部20%變體抗體fv片段的。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,關(guān)于vh-vl取向,所述的選擇是取消選定最差的20%變體抗體fv片段。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,通過計(jì)算六個(gè)ab角vh-vl取向參數(shù)來確定vh-vl取向。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,通過使用隨機(jī)的森林方法計(jì)算所述的ab角vh-vl取向參數(shù)來確定vh-vl取向。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,通過對(duì)于每一個(gè)ab角使用一種隨機(jī)的森林方法計(jì)算所述的ab角vh-vl取向參數(shù)來確定vh-vl取向。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,通過使用隨機(jī)森林模型計(jì)算vh和vl的慣常的扭轉(zhuǎn)角、四個(gè)彎曲角(每個(gè)可變域兩個(gè))和中心軸長度(hl、hc1、lc1、hc2、lc2、dc)來確定vh-vl取向。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,僅僅采用復(fù)合物抗體結(jié)構(gòu)數(shù)據(jù)訓(xùn)練所述的隨機(jī)森林模型。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,最小的差別是在與最高的q2值有關(guān)的真實(shí)的和預(yù)測的角度參數(shù)值之間的最小的差別。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,最小的差別是在與最高的q2值有關(guān)的親本抗體角度參數(shù)和人源化的變體抗體角度參數(shù)值之間的最小的差別。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,最高的結(jié)構(gòu)相似度是最低的平均均方根偏差(rmsd)。在一種實(shí)施方式中,rmsd是針對(duì)非人或親本抗體的氨基酸殘基的所有cα原子(或羰基原子)與變體抗體的相應(yīng)cα原子測定的rmsd。一般而言,通過利用vh-vl預(yù)測子,相對(duì)于結(jié)構(gòu)參比得到了改善。由vh-vl重取向?qū)е碌牡臏p小通常轉(zhuǎn)化成更好的rmsd值,特別是相對(duì)于構(gòu)架區(qū)。平均起來,對(duì)于完整的fv發(fā)現(xiàn)了的顯著的改善和羰基rmsd的改善。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,把在從或者共有vh或者vl構(gòu)架上比對(duì),隨后在共有fv構(gòu)架上進(jìn)行vh-vl重定向的模板結(jié)構(gòu)裝配的模型用于測定vh-vl取向。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,把在完全的fv(vh和vl同時(shí))的β-片層核心上比對(duì)的模型用于測定vh-vl取向。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,把其中抗體fv片段在共有fv構(gòu)架上被重取向的模型用于測定vh-vl取向。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,把利用在常見的共有fv構(gòu)架上比對(duì)的模板結(jié)構(gòu)并且vh-vl取向不以任何形式被調(diào)整的模型用于測定vh-vl取向。在如本文報(bào)道的所有方面的一個(gè)實(shí)施方式中,把從在或者共有vh或者vl構(gòu)架上比對(duì),隨后在基于相似度選擇的vh-vl取向模板結(jié)構(gòu)上進(jìn)行vh-vl重取向的模板結(jié)構(gòu)裝配的模型用于測定vh-vl取向。根據(jù)本文中報(bào)道的一個(gè)方面是用于生產(chǎn)抗體的方法,其包括下列步驟:-根據(jù)在本文中報(bào)道的方法選擇一種或更多種抗體或抗體fv片段,-基于它的結(jié)合性質(zhì),從所述的一種或更多種抗體或抗體fv片段中選擇單一的抗體或抗體fv片段,-把編碼vh和vl的核酸克隆到一種或更多種表達(dá)載體中,-采用在前一步驟中獲得的表達(dá)載體轉(zhuǎn)染細(xì)胞,-培養(yǎng)所轉(zhuǎn)染的細(xì)胞并且從而生產(chǎn)所述的抗體。根據(jù)本文中報(bào)道的一個(gè)方面是用于生產(chǎn)抗體的方法,其包括下列步驟:-選擇一種或更多種抗體或抗體fv片段,其包括下列步驟:-通過把來自非人抗體的一個(gè)或更多個(gè)決定特異性的殘基移植/轉(zhuǎn)移到人或人源化的受體抗體或種系抗體序列上而產(chǎn)生許多變體抗體,由此許多變體抗體中的每一種變體抗體與其它變體抗體至少有一個(gè)氨基酸殘基不同,-通過利用基于由抗體fv片段的殘基h33、h35、h37、h39、h43、h44、h45、h46、h47、h50、h55、h56、h58、h60、h61、h62、h89、h91、h95、h96、h98、h99、h100x-2、h100x-1、h100x、h101、h102、h103、h105、l32、l34、l36、l38、l41、l42、l43、l44、l45、l46、l49、l50、l53、l55、l56、l85、l87、l89、l91、l93、l94/i95x-1、i9sx、l96、l97、l100(根據(jù)chothia指標(biāo)編號(hào))組成的一組vh-vl界面殘基的隨機(jī)森林模型,計(jì)算vh和vl的慣常的扭轉(zhuǎn)角、四個(gè)彎曲角(每個(gè)可變域兩個(gè))和中心軸長度(hl、hc1、lc1、hc2、lc2、dc),確定非人抗體fv片段和許多變體抗體中的每一種變體抗體的fv片段的vh-vl取向,-選擇針對(duì)所有對(duì)的非人抗體fv片段和變體抗體fv片段的相應(yīng)的cα原子確定的具有最小的平均均方根偏差(rmsd)的那些變體抗體fv片段,-基于它的結(jié)合性質(zhì),從所述的一種或更多種抗體中選擇單一抗體,-把編碼vh和vl的核酸克隆到一種或更多種表達(dá)載體中,-采用在前一步驟中獲得的表達(dá)載體轉(zhuǎn)染細(xì)胞,-培養(yǎng)所轉(zhuǎn)染的細(xì)胞并且從而生產(chǎn)所述的抗體。根據(jù)本文中報(bào)道的一個(gè)方面是人源化的抗體,其在輕和重鏈可變域中在氨基酸位置l26-l32、l44、l46、l50-l52、l87、l91-l96、h26-h32、h45、h53-h55、h62和h96-h101(根據(jù)chothia指標(biāo)編號(hào))處包含來自供體非人抗體的氨基酸殘基并且在其余位置處包含來自受體人或人源化的抗體或受體人種系氨基酸序列的殘基。根據(jù)本文中報(bào)道的一個(gè)方面是人源化的抗體,其在輕和重鏈可變域中在氨基酸位置h26-h32、h35、h37、h39、h45、h47、h50、h53-h55、h58、h60、h61、h91、h95、h96-h101、h102、h103、h105、l26-l32、l34、l36、l38、l43、l44、l46、l49、l50-l52、l55、l87、l89、l91-l96(根據(jù)chothia指標(biāo)編號(hào))處包含來自供體非人抗體的氨基酸殘基并且在其余位置處包含來自受體人或人源化的抗體或受體人種系氨基酸序列的殘基。根據(jù)本文中報(bào)道的一個(gè)方面是人源化的抗體,其在輕和重鏈可變域中在氨基酸位置h26-h32、h33、h35、h43、h44、h46、h50、h53-h55、h56、h58、h61、h62、h89、h96-h101、l26-l32、l34、l36、l38、l41、l42、l43、l44、l45、l46、l49、l50-l52、l53、l55、l56、l85、l87、l89、l91-l96、l97、l100(根據(jù)chothia指標(biāo)編號(hào))處包含來自供體非人抗體的氨基酸殘基并且在其余位置處包含來自受體人或人源化的抗體或受體人種系氨基酸序列的殘基。根據(jù)本文中報(bào)道的一個(gè)方面是人源化的抗體,其在輕和重鏈可變域中在氨基酸位置h26-h32、h33、h35、h37、h39、h43、h44、h45、h46、h47、h50、h53-h55、h56、h58、h60、h61、h62、h89、h91、h95、h96-h101、h102、h103、h105、l26-l32、l34、l36、l38、l41、l42、l43、l44、l45、l46、l49、l50-l52、l53、l55、l56、l85、l87、l89、l91-l96、l97、l100(根據(jù)chothia指標(biāo)編號(hào))處包含來自供體非人抗體的氨基酸殘基并且在其余位置處包含來自受體人或人源化的抗體或受體人種系氨基酸序列的殘基。根據(jù)本文中報(bào)道的一個(gè)方面是人源化的抗體,其在輕和重鏈可變域中在氨基酸位置h26-h32、h35、h37、h39、h45、h47、h50、h53-h55、h58、h60、h61、h91、h95、h96-h101、h102、h103、h105、l26-l32、l34、l36、l38、l43、l44、l46、l49、l50-l52、l55、l87、l89、l91-l96、l98(根據(jù)chothia指標(biāo)編號(hào))處包含來自供體非人抗體的氨基酸殘基并且在其余位置處包含來自受體人或人源化的抗體或受體人種系氨基酸序列的殘基。根據(jù)本文中報(bào)道的一個(gè)方面是人源化的抗體,其在輕和重鏈可變域中在氨基酸位置h26-h32、h33、h35、h37、h39、h43、h44、h45、h46、h47、h50、h53-h55、h56、h58、h60、h61、h62、h89、h91、h95、h96-h101、h102、h103、h105、l26-l32、l34、l36、l38、l41、l42、l43、l44、l45、l46、l49、l50-l52、l53、l55、l56、l85、l87、l89、l91-l96、l97、l98、l100(根據(jù)chothia指標(biāo)編號(hào))處包含來自供體非人抗體的氨基酸殘基并且在其余位置處包含來自受體人或人源化的抗體或受體人種系氨基酸序列的殘基。附圖描述圖1分別從具有pdbid1n7m、1dlf和3hzm的晶體結(jié)構(gòu)取得的具有5、10和15個(gè)氨基酸長度的三種示例性的cdr-h3環(huán)的疊加:a)chothia/kabat編號(hào)顯示在三種代表性的cdr-h3環(huán)中殘基97的寬的空間分布;b)wolfguy編號(hào)顯示殘基97的緊湊的空間定位,因?yàn)樗偸窃赾dr-h3的末端之前的第三至最后一個(gè)殘基,根據(jù)wolfguy指標(biāo)命名的397;c)來自cdr的幾個(gè)氨基酸具有鏈間接觸,特別是位于cdr-h3和cdr-l3的末端的那些(根據(jù)wolfguy指標(biāo)的殘基797清楚地與vh定位共定位并且進(jìn)行接觸)。圖2針對(duì)關(guān)于單獨(dú)的復(fù)合物結(jié)構(gòu)的試驗(yàn)數(shù)據(jù)集的示例性運(yùn)行,預(yù)測的(縱軸)對(duì)真實(shí)的ab角取向參數(shù)(橫軸)(把2/3的復(fù)合物結(jié)構(gòu)用作訓(xùn)練組,而1/3用作試驗(yàn)組)。完美的預(yù)測將依賴于對(duì)角線。圖3在預(yù)測子訓(xùn)練期間關(guān)于用篩選頻度百分比的六個(gè)ab角參數(shù)的頂部25個(gè)重要的指紋3位置。采用改變的隨機(jī)選擇的訓(xùn)練組(單獨(dú)的復(fù)合物結(jié)構(gòu))在十次運(yùn)行上求所述值的平均值。誤差線對(duì)應(yīng)于一個(gè)標(biāo)準(zhǔn)差。構(gòu)架和cdr分類遵循wolfguy命名法。圖4當(dāng)使用不受限制的代替受限制的最小化時(shí),在構(gòu)架(fw)、cdr(cdr)和所有fv殘基(all)的羰基rmsd方面的平均變化和在distab角方面的平均變化(顯示了三種變體i、ii、iii對(duì)1、2、3)。圖5在構(gòu)架(fw)、cdr(cdr)和所有fv殘基(all)的羰基rmsd方面的平均變化和在原始模型和重取向模型之間在每種amaii抗體的distab角方面的平均變化。圖6在構(gòu)架(fw)、cdr(cdr)和所有fv殘基(all)的羰基rmsd方面的平均變化和在原始模型和重取向的模型之間在每種amaii參與者的distab角方面的平均變化。圖7按照它們的平均角度-距離把hc(矩陣的行,左邊)和lc(矩陣的列,右邊)分類。這些設(shè)想被用來剔除“壞的”hc/lc。圖8具有不同的hc/lc組合的elisa測定值的矩陣。通過不同的方法取消選擇的抗體是帶陰影的;1:壞的hc/lc組合;2:被舍棄的全部hc/lc;3:最壞的20%。圖9所有三種篩選方法“壞的hc/lc組合”(左邊)、“全部hc和lc”(中間)和“最壞的20%”(右邊)的elisa測定值的堆疊直方圖。直方圖條形的淺灰色區(qū)域指示被舍棄的抗體。圖10按照它們的平均角度-距離把hc(矩陣的行,左邊)和lc(矩陣的列,右邊)分類。這些設(shè)想被用來剔除“壞的”hc/lc。圖11具有不同的hc/lc組合的elisa測定值的矩陣。通過不同的方法取消選擇的抗體是有陰影的;1:壞的hc/lc組合;2:被舍棄的全部hc/lc;3:最壞的20%。圖12所有三種篩選方法““壞的hc/lc組合”(左邊)、“全部hc和lc”(中間)和“最壞的20%”(右邊)的elisa測定值的堆疊直方圖。直方圖條形的淺灰色區(qū)域指示被舍棄的抗體。圖13按照它們的平均角度-距離把hc(矩陣的行,左邊)和lc(矩陣的列,右邊)分類。這些可視化被用來選擇“壞的”hc/lc。圖14三幅圖,每一幅顯示具有不同的hc/lc組合的bl測定值的矩陣;通過不同的方法取消選擇的抗體是有陰影的;1:壞的hc/lc組合;2:被舍棄的全部hc/lc;3:最壞的20%。圖15所有三種方法“壞的hc/lc組合”(左邊)、“全部hc和lc”(中間)和“最壞的20%”(右邊)的elisa測定值的堆疊直方圖。直方圖條形的淺灰色區(qū)域指示被取消選擇的抗體。圖16三幅圖,每一幅顯示具有不同的hc/lc組合的t1/2測定值的矩陣;通過不同的方法選擇的抗體是有陰影的;1:壞的hc/lc組合;2:被舍棄的全部hc/lc;3:最壞的20%。圖17所有三種方法“壞的hc/lc組合”(左邊)、“全部hc和lc”(中間)和“最壞的20%”(右邊)的t1/2測定值的堆疊直方圖。直方圖條形的淺灰色區(qū)域指示被取消選擇的抗體。定義wolfguy編號(hào)方案所述的wolfguy編號(hào)像kabat和chothia定義的并集那樣定義cdr區(qū)。而且,所述的編號(hào)方案基于cdr長度(并且部分地基于序列)注釋cdr環(huán)尖端,使得cdr位置指標(biāo)指示cdr殘基是否是上行或下行環(huán)的一部分。在表1中顯示了與已建立的編號(hào)方案的比較。表1:使用chothia/kabat(ch-kb)、honegger和wolfguy編號(hào)方案給cdr-l3和cdr-h3編號(hào)。后者具有從n-末端基底到cdr頂點(diǎn)遞增的編號(hào)以及從c-末端cdr端開始遞減的編號(hào)。kabat方案固定最后兩個(gè)cdr殘基并且引入字母以適應(yīng)cdr長度。與kabat命名法對(duì)比,honegger編號(hào)不使用字母并且對(duì)于vh和vl是常見的。這樣設(shè)計(jì)wolfguy,使得盡可能采用等效的指標(biāo)來給結(jié)構(gòu)上等效的殘基(即在fv結(jié)構(gòu)中在保守的空間定位方面非常相似的殘基)編號(hào)。在圖1中舉例說明了這一點(diǎn)。關(guān)于wolfguy編號(hào)的全長vh和vl序列的例子可以在表2中找到。表2:采用wolfguy、kabat和chothia編號(hào)的具有pdbid3pp4(21)的晶體結(jié)構(gòu)的vh(左邊)和vl(右邊)序列。在wolfguy中,僅僅根據(jù)長度給cdr-h1-h3、cdr-l2和cdr-l3編號(hào),同時(shí)根據(jù)環(huán)長度和規(guī)范簇關(guān)系給cdr-l1編號(hào)。通過計(jì)算與不同的共有序列的序列相似度來確定規(guī)范簇關(guān)系。在這里,我們僅僅提供cdr-l1編號(hào)的單個(gè)例子,因?yàn)樗鼘?duì)于產(chǎn)生我們的vh-vl取向序列指紋是不重要的。ab角概念(7)當(dāng)在任何兩個(gè)基于氨基酸的結(jié)構(gòu)之間進(jìn)行比較時(shí),一般地使用基于距離的矩陣?yán)绲刃г拥木礁?rmsd)。為了表征任何兩個(gè)三維物體之間的取向,有必要定義:-關(guān)于每個(gè)物體的參考構(gòu)架。-用來測定有關(guān)的取向參數(shù)的軸。-用來描述和定量這些參數(shù)的術(shù)語。所述的ab角概念是一種方法,其使用五個(gè)角度(hl、hc1、lc1、hc2和lc2)和一個(gè)距離(dc)在一種一致的并且絕對(duì)的意義上完全地表征vh-vl取向。以總體方式把抗體的可變域?qū)h和vl表示成抗體fv片段。在第一步中,從數(shù)據(jù)庫(例如蛋白質(zhì)數(shù)據(jù)庫,pdb)中提取抗體結(jié)構(gòu)。把chothia抗體編號(hào)(chothia和lesk,1987)應(yīng)用于每一條抗體鏈。使成功地編號(hào)的鏈配對(duì)而形成fv區(qū)。這是通過應(yīng)用下列約束條件而進(jìn)行的:重鏈的h37位cα坐標(biāo)(在重鏈可變域第37位的氨基酸殘基的α碳原子)必須在輕鏈的l87位cα坐標(biāo)的范圍之內(nèi)。非冗余組的抗體是使用cdhit(li,w.和godzik,a.bioinformatics,22(2006)1658-1659),在99%的fv區(qū)的構(gòu)架上應(yīng)用序列同一性截止而產(chǎn)生的。使用在重和輕結(jié)構(gòu)域中在結(jié)構(gòu)上最保守的殘基位置來定義結(jié)構(gòu)域位置。把這些位置表示成vh和vl核心組。這些位置主要地位于構(gòu)架的β鏈上并且形成每個(gè)結(jié)構(gòu)域的核心。在下面的表3中提供了所述的核心組的位置:使用所述的核心組位置來把參照的構(gòu)架登記在抗體fv區(qū)結(jié)構(gòu)域上。使用cdhit,在結(jié)構(gòu)域中的構(gòu)架位置上應(yīng)用80%的序列同一性截止值,將非冗余數(shù)據(jù)集中的vh結(jié)構(gòu)域聚類。從30個(gè)最大的聚類中的每一個(gè)隨機(jī)地選擇一個(gè)結(jié)構(gòu)。使用mammoth-mult(lupyan,d.等人,bioinf.21(2005)3255-3263)在vh核心組位置上比對(duì)這組結(jié)構(gòu)域。從這種比對(duì)中提取對(duì)應(yīng)于β-片層界面中的八個(gè)在結(jié)構(gòu)上保守的位置h36、h37、h38、h39、h89、h90、h91和h92的cα坐標(biāo)。通過所產(chǎn)生的240個(gè)坐標(biāo)擬合一個(gè)一個(gè)平面。對(duì)于vl結(jié)構(gòu)域,使用位置l35、l36、l37、l38、l85、l86、l87和l88來擬合所述的平面。上面描述的步驟允許把兩個(gè)參考構(gòu)架平面映射在任何fv結(jié)構(gòu)上。因此,可以使得測量vh-vl取向等效于測量所述的兩個(gè)平面之間的取向。為了完全地并且在絕對(duì)意義上做到這一點(diǎn),需要至少六個(gè)參數(shù):距離、扭轉(zhuǎn)角和四個(gè)彎曲角。必須針對(duì)連接所述的平面的一致地定義的向量來測量這些參數(shù)。在下面這種向量被表示為c。為了識(shí)別c,把參考構(gòu)架平面登記在如上所述的非冗余組中的每一個(gè)結(jié)構(gòu)上并且在每一個(gè)平面上設(shè)置網(wǎng)格。因此每個(gè)結(jié)構(gòu)具有等效的網(wǎng)格點(diǎn)以及如此等效的vh-vl網(wǎng)格點(diǎn)對(duì)。在每個(gè)結(jié)構(gòu)中針對(duì)每一對(duì)網(wǎng)格點(diǎn)測量歐幾里德距離。鑒別在它們的分離距離方面具有最小方差的點(diǎn)對(duì)。把連接這些點(diǎn)的向量定義為c。使用位于每個(gè)平面中并且以對(duì)應(yīng)于c的網(wǎng)格點(diǎn)為中心的向量來完全地定義坐標(biāo)系。h1是與vh平面的第一主分量平行運(yùn)行的向量,同時(shí)h2與第二主分量平行運(yùn)行。類似地在vl結(jié)構(gòu)域上定義l1和l2。hl角是在所述的兩個(gè)結(jié)構(gòu)域之間的扭轉(zhuǎn)角。hc1和lc1彎曲角等效于一個(gè)結(jié)構(gòu)域相對(duì)于另一個(gè)結(jié)構(gòu)域的傾斜樣的變化。hc2和lc2彎曲角描述一個(gè)結(jié)構(gòu)域相對(duì)于另一個(gè)結(jié)構(gòu)域的扭曲樣的變化。為了描述vh-vl取向,使用六個(gè)度量:距離和五個(gè)角度。在坐標(biāo)系中把這些定義如下:-c的長度,dc,-針對(duì)c測量的從h1到l1的扭轉(zhuǎn)角hl,-在h1和c之間的彎曲角hc1,-在h2和c之間的彎曲角hc2,-在l1和c之間的彎曲角lc1,以及-在l2和c之間的彎曲角lc2。按照本領(lǐng)域中通常的意義使用術(shù)語“vh-vl取向”,正如本領(lǐng)域的技術(shù)人員將會(huì)理解的那樣(參見例如dunbar等人,prot.eng.des.sel.26(2013)611-620;和bujotzek,a.等人,proteins,struct.funct.bioinf.,83(2015)681-695)。它表示vh和vl結(jié)構(gòu)域相對(duì)于彼此怎樣取向。因此,vh-vl取向是由下列確定的:-c的長度,dc,-針對(duì)c測量的從h1到l1的扭轉(zhuǎn)角hl,-在h1和c之間的彎曲角hc1,-在h2和c之間的彎曲角hc2,-在l1和c之間的彎曲角lc1,以及-在l2和c之間的彎曲角lc2,其中通過下列登記參考構(gòu)架平面:i)比對(duì)對(duì)應(yīng)于vh的八個(gè)位置h36、h37、h38、h39、h89、h90、h91和h92的cα坐標(biāo)并且通過它們擬合一個(gè)平面,和ii)比對(duì)對(duì)應(yīng)于vl的八個(gè)位置l35、l36、l37、l38、l85、l86、l87和l88的cα坐標(biāo)并且通過它們擬合一個(gè)平面,iii)在每個(gè)平面上設(shè)置一個(gè)位置,由此每個(gè)結(jié)構(gòu)具有等效的網(wǎng)格點(diǎn)和等效的vh-vl網(wǎng)格點(diǎn)對(duì),以及iv)在每個(gè)結(jié)構(gòu)中對(duì)于每一個(gè)網(wǎng)格點(diǎn)對(duì),測量歐幾里德距離,由此向量c把在它們的分離距離方面具有最小方差的網(wǎng)格點(diǎn)對(duì)連接起來,其中h1是與vh平面的第一主分量平行運(yùn)行的向量,同時(shí)h2是與vh平面的第二主分量平行運(yùn)行的向量,l1是與vl平面的第一主分量平行運(yùn)行的向量,l2是與vl平面的第二主分量平行運(yùn)行的向量,hl角是在所述的兩個(gè)結(jié)構(gòu)域之間的扭轉(zhuǎn)角,hc1和lc1是等效于一個(gè)結(jié)構(gòu)域相對(duì)于另一個(gè)結(jié)構(gòu)域的傾斜樣變化的彎曲角,以及hc2和lc2彎曲角等效于一個(gè)結(jié)構(gòu)域相對(duì)于另一個(gè)結(jié)構(gòu)域的扭曲樣的變化。按照chothia指標(biāo)確定了所述的位置。選擇向量c使其在所述的非冗余組的結(jié)構(gòu)上具有最保守的長度。距離dc是這個(gè)長度。它具有16.2的平均值以及僅僅0.3的標(biāo)準(zhǔn)差。表4列出了通過隨機(jī)森林算法鑒定為在確定vh-vl取向的每一個(gè)角度尺寸方面重要的頂部10個(gè)位置和殘基。表4:x代表變量l36va/l38eb/l42ha/l43la/l44fa,b/l45t/l46gb/l49g/l95h(關(guān)于更詳細(xì)的信息,參見參考文獻(xiàn)7和bujotzek,a.等人,prot.struct.funct.bioinf.83(2015)681-695,將它們的全部引用并入本文)。更多的定義:“受體人構(gòu)架”用于本文的目的是包含來源于人免疫球蛋白構(gòu)架或人共有構(gòu)架的輕鏈可變域(vl)構(gòu)架或重鏈可變域(vh)構(gòu)架的氨基酸序列的構(gòu)架,正如在下面定義的那樣。“來源于”人免疫球蛋白構(gòu)架或人共有構(gòu)架的受體人構(gòu)架可以包含其相同的氨基酸序列,或者它可以包含氨基酸序列變化。在一些實(shí)施方式中,氨基酸數(shù)目的變化是10個(gè)或更少、9個(gè)或更少、8個(gè)或更少、7個(gè)或更少、6個(gè)或更少、5個(gè)或更少、4個(gè)或更少、3個(gè)或更少或2個(gè)或更少。在一些實(shí)施方式中,vl受體人構(gòu)架在序列方面與vl人免疫球蛋白構(gòu)架序列或人共有構(gòu)架序列相同?!坝H和性”是指在分子(例如抗體)的單個(gè)結(jié)合位點(diǎn)和它的結(jié)合配偶體(例如抗原)之間全部非共價(jià)相互作用的強(qiáng)度。正如本文中所用的那樣,除非以其它方式指出,“結(jié)合親和性”是指反映結(jié)合對(duì)(例如抗體和抗原)的成員之間1∶1相互作用的固有結(jié)合親和性。分子x對(duì)于它的配偶體y的親和性一般地可以用解離常數(shù)(kd)表示。可以通過包括本文中描述的那些方法在內(nèi)的本領(lǐng)域中已知的常見方法來測定親和性。用于測定結(jié)合親和性的具體的舉例說明的和示范性的實(shí)施方式被描述在下列中。在本文中術(shù)語“抗體”以最廣泛的意義被使用并且包括不同的抗體結(jié)構(gòu),包括但不限于單克隆抗體、多克隆抗體、多特異性抗體(例如雙特異性抗體)以及抗體片段,只要它們展示所要的抗原結(jié)合活性?!翱贵w片段”是指除完整抗體以外的分子,它包括完整抗體的一部分,其結(jié)合完整抗體所結(jié)合的抗原??贵w片段的實(shí)例包括但是不局限于fv、fab、fab’、fab-sh、f(ab’)2;雙抗體;線性抗體;單鏈抗體分子(例如scfv);和由抗體片段形成的多特異性抗體。術(shù)語“嵌合的”抗體是指其中重和/或輕鏈的一部分源自于特定的來源或物種,同時(shí)重和/或輕鏈的其余部分源自于不同的來源或物種的抗體??贵w的“類別”是指由它的重鏈占有的恒定域或恒定區(qū)的類型。有五個(gè)主要的抗體類別:iga、igd、ige、igg和igm,并且這些中的幾個(gè)可以被進(jìn)一步分成亞類(同種型),例如igg1、igg2、igg3、igg4、iga1和iga2。對(duì)應(yīng)于不同類別的免疫球蛋白的重鏈恒定域分別被稱為α、β、ε、γ和μ。在本文中使用術(shù)語“fc區(qū)”來定義包含至少一部分恒定區(qū)的免疫球蛋白重鏈的c端區(qū)域。該術(shù)語包括天然序列的fc區(qū)和變體fc區(qū)。在一種實(shí)施方式中,人igg重鏈fc區(qū)從cys226或從pro230延伸到重鏈的羧基端。然而,fc區(qū)的c端賴氨酸(lys447)可以存在或可以不存在。在本文中除非另外指定,在fc區(qū)或恒定區(qū)中氨基酸殘基的編號(hào)是根據(jù)eu編號(hào)系統(tǒng),也被稱為eu指標(biāo),正如在kabat,e.a.等人,sequencesofproteinsofimmunologicalinterest,第五版,publichealthservice,nationalinstitutesofhealth,bethesda,md(1991),nihpublication91-3242中描述的那樣?!皹?gòu)架”或“fr”是指除高變區(qū)(hvr)殘基以外的可變域殘基??勺冇虻膄r一般地由四個(gè)fr結(jié)構(gòu)域組成:fri、fr2、fr3和fr4。因此,hvr和fr序列一般地出現(xiàn)在vh(或vl)中的下列序列中:fr1-hi(l1)-fr2-h2(l2)-fr3-h3(l3)-fr4。在本文中術(shù)語“全長抗體”、“完整的抗體”和“整個(gè)抗體”可被互換地使用,是指具有實(shí)質(zhì)上類似于天然的抗體結(jié)構(gòu)的結(jié)構(gòu)或具有包含在本文中所定義的fc區(qū)的重鏈的抗體?!叭丝贵w”是具有對(duì)應(yīng)于由人或人細(xì)胞生產(chǎn)的抗體的氨基酸序列的氨基酸序列的抗體或來源于非人來源利用人抗體全部組成成分或其它人抗體編碼序列的抗體。人抗體的這種定義具體地排除了包含結(jié)合非人抗原的殘基的人源化的抗體。在人免疫球蛋白vl或vh構(gòu)架序列的選擇中,“人共有構(gòu)架”是代表最通常地存在的氨基酸殘基的構(gòu)架。一般地,對(duì)人免疫球蛋白vl或vh序列的選擇來自可變域序列的亞群。一般地,所述的序列亞群是正如在kabat,e.a.等人,sequencesofproteinsofimmunologicalinterest,第五版,bethesdamd(1991),nihpublication91-3242,第1-3卷中那樣的亞群。在一種實(shí)施方式中,對(duì)于vl,所述的亞群是正如在kabat等人,上文中那樣的亞群kappai。在一種實(shí)施方式中,對(duì)于vh,所述的亞群是正如在kabat等人,上文中那樣的亞群iii?!叭嗽椿摹笨贵w是指包含來自非人hvr的氨基酸殘基和來自人fr的氨基酸殘基的嵌合抗體。在某些實(shí)施方式中,人源化的抗體將會(huì)實(shí)質(zhì)上包含全部的至少一個(gè)并且典型地兩個(gè)可變域,其中全部的或?qū)嵸|(zhì)上全部的hvr(例如cdr)對(duì)應(yīng)于非人抗體的那些,并且全部的或?qū)嵸|(zhì)上全部的fr對(duì)應(yīng)于人抗體的那些。人源化的抗體任選地可以包含來源于人抗體的至少一部分抗體恒定區(qū)?!叭嗽椿男问健钡目贵w例如非人抗體是指已經(jīng)經(jīng)歷人源化的抗體。正如本文中所用的那樣,術(shù)語“高變區(qū)”或“hvr”是指在序列中是高變的(″互補(bǔ)決定區(qū)″或″cdr″)和/或在結(jié)構(gòu)上形成確定的環(huán)(“高變環(huán)”)和/或包含接觸抗原的殘基(“抗原觸點(diǎn)”)的抗體可變域的每一個(gè)區(qū)。一般地,抗體包含六個(gè)hvr;三個(gè)在vh中(h1、h2、h3),以及三個(gè)在vl中(l1、l2、l3)。在本文中hvr包括(a)高變環(huán),其存在于氨基酸殘基26-32(l1)、50-52(l2)、91-96(l3)、26-32(h1)、53-55(h2)和96-101(h3)處(chothia,c.和lesk,a.m.,j.mol.biol.196(1987)901-917);(b)cdr,其存在于氨基酸殘基24-34(l1)、50-56(l2)、89-97(l3)、31-35b(h1)、50-65(h2)和95-102(h3)處(kabat,e.a.等人,sequencesofproteinsofimmunologicalinterest,第五版,publichealthservice,nationalinstitutesofhealth,bethesda,md(1991),nihpublication91-3242.);(c)抗原觸點(diǎn),其存在于氨基酸殘基27c-36(l1)、46-55(l2)、89-96(l3)、30-35b(h1)、47-58(h2)和93-101(h3)處(maccallum等人,j.mol.biol.262:732-745(1996));和(d)(a)、(b)和/或(c)的組合,包括hvr氨基酸殘基46-56(l1)、47-56(l2)、48-56(l2)、49-56(l2)、26-35(h1)、26-35b(h1)、49-65(h2)、93-102(h3)和94-102(h3)。除非另有指示,在本文中根據(jù)kabat等人,上文來給可變域中的hvr殘基以及其它殘基(例如fr殘基)編號(hào)。根據(jù)它在本領(lǐng)域中的意義來使用術(shù)語“特異性決定殘基”。它定義直接地參與抗原的相互作用的抗體的殘基(參見例如padlan,e.a.等人,fasebj.9(1995)133-139)。“分離的”抗體是已經(jīng)被從它的自然環(huán)境的組分中分離出來的抗體。在一些實(shí)施方式中,抗體被純化到大于95%或99%純度,正如通過例如電泳(例如sds-page、等電點(diǎn)聚焦(ief)、毛細(xì)管電泳)或?qū)游?例如離子交換或反相hplc)測定的那樣。關(guān)于用于評(píng)估抗體純度的方法的綜述,參見例如flatman,s.等人,j.chromatogr.b848(2007)79-87。正如本文中所用的那樣,術(shù)語“單克隆抗體”是指從實(shí)質(zhì)上同質(zhì)的抗體群中獲得的抗體,即包含在所述的群的單個(gè)抗體是相同的和/或結(jié)合相同的表位,除了可能的變體抗體以外,例如包含天然存在的突變或在生產(chǎn)單克隆抗體制劑期間產(chǎn)生的,這樣的變體一般地以微小的數(shù)量存在。與典型地包括針對(duì)不同的決定簇(表位)的不同抗體的多克隆抗體制劑相比,單克隆抗體制劑中的每一種單克隆抗體針對(duì)抗原上的單一決定簇。因此,所述的修飾語“單克隆的”指示抗體的特性是從實(shí)質(zhì)上同質(zhì)的抗體群中獲得的,并且不被解釋為需要通過任何特定的方法生產(chǎn)抗體。例如,可以通過多種技術(shù)來制造根據(jù)本發(fā)明將要被使用的單克隆抗體,這些技術(shù)包括但不限于雜交瘤方法、重組dna方法、噬菌體展示方法和利用包含全部或一部分人免疫球蛋白基因座的轉(zhuǎn)基因動(dòng)物的方法,這樣的方法以及其它示范性的方法用于制造本文中描述的單克隆抗體。術(shù)語“可變區(qū)”或“可變域”是指參與抗體與抗原結(jié)合的抗體重或輕鏈的結(jié)構(gòu)域。天然抗體的重鏈和輕鏈的可變域(分別為vh和vl)一般地具有相似的結(jié)構(gòu),同時(shí)每個(gè)結(jié)構(gòu)域包含四個(gè)保守性構(gòu)架區(qū)(fr)和三個(gè)高變區(qū)(hvr)。(參見,例如kindt,t.j.等人,kubyimmunology,第6版,w.h.freemanandco.,n.y.(2007),第91頁)。單個(gè)vh或vl結(jié)構(gòu)域可以足以賦予抗原結(jié)合特異性。而且,可以使用來自結(jié)合所述抗原的抗體的vh或vl結(jié)構(gòu)域來分離結(jié)合特定抗原的抗體,從而分別地篩選互補(bǔ)的vl或vh結(jié)構(gòu)域的庫。參見例如portolano,s.等人,j.immunol.150(1993)880-887;clarkson,t.等人,nature352(1991)624-628)。發(fā)明詳述在本文中報(bào)道了基于序列的快速預(yù)測子,其預(yù)測vh-vl域間取向。實(shí)現(xiàn)了范圍從0.67到0.80的q2值。根據(jù)六個(gè)絕對(duì)的ab角參數(shù)描述了vh-vl取向以把vh-vl取向的不同自由度精確地分開。在不同的抗體結(jié)構(gòu)上評(píng)估了vh-vl取向的影響。已經(jīng)發(fā)現(xiàn)采用在本文中報(bào)道的方法可以達(dá)到關(guān)于變體(人源化的)抗體的vh-vl取向偏差相對(duì)于親本(非人)抗體的改善。通過氨基酸主鏈的羰基原子的平均均方根偏差(rmsd)顯示了這一點(diǎn)。這顯示關(guān)于在親本(非人)和變體(人源化的)抗體之間vh-vl域間角的相似度方面的改善。在本文中所報(bào)道的方法(包括移植方法)正在遞送變體(人源化的)抗體的更好的結(jié)合性質(zhì)??梢园哑渌こ袒椒ɡ鐦?gòu)架改組與在本文中報(bào)道的方法組合,當(dāng)把一種人構(gòu)架轉(zhuǎn)換為另一種以便改變抗體的生物物理特性時(shí),導(dǎo)致所獲得的變體抗體的改善的結(jié)合。這導(dǎo)致提供用于從來源于親本抗體的許多變體抗體中選擇更好的人源化抗體的方法??贵w在治療學(xué)和臨床診斷學(xué)中的用途產(chǎn)生了對(duì)抗體結(jié)構(gòu)精確的同源性模型的需要,每當(dāng)不可得到晶體結(jié)構(gòu)時(shí),該模型確保合理的抗體工程化。因此,已經(jīng)發(fā)展了許多用于計(jì)算機(jī)輔助的抗體設(shè)計(jì)(1)的計(jì)算方法,在它們之中許多同源性建模方法被通過盲建模研究(8,2)有規(guī)則地評(píng)估。由于在實(shí)驗(yàn)上衍生的抗體結(jié)構(gòu)的數(shù)目(結(jié)構(gòu)上的抗體數(shù)據(jù)庫sabdab3把1841個(gè)條目算作是2014年5月的),與其它生物分子的同源性模型相比,抗體同源性模型的品質(zhì)是優(yōu)良的。所述的兩種抗體可變片段(fv)的六種抗原結(jié)合環(huán)在序列方面是高變的(高變區(qū),hvr)。它們中的五種易于適應(yīng)正則構(gòu)象,可以從基于現(xiàn)有的模板結(jié)構(gòu)的序列中預(yù)測該正則構(gòu)象。這一點(diǎn)不適用于在重鏈可變區(qū)上的第三個(gè)環(huán)hvr-h3。hvr-h3是在序列和長度方面最可變的環(huán),并且典型地是主要的抗原相互作用特異性決定位點(diǎn)??贵w的抗原結(jié)合位點(diǎn)在兩種fv(重鏈可變域(vh)和輕鏈可變域(vl))的界面處形成。每一種可變域包含三個(gè)hvr。vh和vl結(jié)構(gòu)域的相對(duì)取向增加了抗原結(jié)合位點(diǎn)的拓?fù)鋵W(xué)。在它們最近的抗體建模評(píng)估研究2(amaii)中,teplyakov等人(2)使用了單個(gè)角測度來描述vh-vl取向。利用一組在結(jié)構(gòu)上保守的β-片層核心位置,把在vh-vl傾角相對(duì)于參比結(jié)構(gòu)方面的差別計(jì)算成通過vl和vh結(jié)構(gòu)域的順序疊加而實(shí)現(xiàn)的坐標(biāo)變換的球面角系統(tǒng)(ω,φ,κ)中的κ角。narayanan等人(6)使用基于rmsd(均方根偏差)的量度來訓(xùn)練和評(píng)估基于能量的vh-vl取向的預(yù)測子。chailyan以及同事(5)鑒定了具有類似的vh-vl取向的fv結(jié)構(gòu)簇并且通過測定某些保守性殘基的cα疊加rmsd確定了有影響的序列位置。其它研究通過提供一種晶體結(jié)構(gòu)的vh或vl在另一種晶體結(jié)構(gòu)上的重取向所必需的旋轉(zhuǎn)量而增大rmsd值(10-12)。abhinandan和martin(4)定義了vh-vl堆積角,一種用于比較vh-vl取向的絕對(duì)量度。vh-vl堆積角是由通過在兩個(gè)結(jié)構(gòu)域中的每一個(gè)中一組高度保守的cα位置的主軸擬合的向量所跨越的扭轉(zhuǎn)角。與相對(duì)的rmsd值對(duì)比,vh-vl堆積角允許用它在結(jié)構(gòu)空間中的vh-vl取向來描述每一個(gè)單個(gè)的fv結(jié)構(gòu)。與vh-vl堆積角的定義一起,作者鑒定了一組有影響的位置并且提供了采用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的基于序列的vh-vl堆積的預(yù)測子。基于過去的觀察(其在被認(rèn)為對(duì)vh-vl取向有影響的fv序列位置方面至少有部分不一致)(4,5),dunbar以及同事(7)提示vh-vl取向受多個(gè)自由度支配,并且每一個(gè)自由度由不同組的有影響的序列位置決定。因此,所述的作者除了慣常的扭轉(zhuǎn)角之外,還確定了四個(gè)彎曲角(每個(gè)可變域兩個(gè))以及vh和vl的中心軸長度,并且利用隨機(jī)森林模型,針對(duì)五個(gè)角參數(shù)(ab角)中的每一個(gè)以及針對(duì)vh和vl之間的中心軸長度,鑒定了最有影響的序列位置。在本文中報(bào)道了用于在抗體的人源化期間表征和利用vh-vl取向的基于ab角的方法。在本文中報(bào)道了針對(duì)六個(gè)ab角量度中的每一個(gè)的基于序列的vh-vl取向的預(yù)測子。還報(bào)道了在真實(shí)的抗體同源性模型中調(diào)節(jié)vh-vl取向的方法。在本文中報(bào)道了用于在結(jié)合決定殘基從供體抗體轉(zhuǎn)移到受體抗體構(gòu)架期間表征和利用vh-vl取向的基于ab角的方法。在本文中報(bào)道了用于在抗體的部分或全部構(gòu)架區(qū)的交換(構(gòu)架改組)期間表征和利用vh-vl取向的基于ab角的方法。vh-vl取向預(yù)測子表5:用于預(yù)測在50次運(yùn)行上平均化的六個(gè)ab角參數(shù)的q2和rmse值。手動(dòng)調(diào)整每個(gè)隨機(jī)森林模型的樹的數(shù)目,以便使q2最大化。在括弧中的數(shù)值具體說明標(biāo)準(zhǔn)差。在apo和復(fù)合物結(jié)構(gòu)(表5,中心列)的完全數(shù)據(jù)集上訓(xùn)練隨機(jī)森林模型一次以及在單獨(dú)的復(fù)合物結(jié)構(gòu)(表格5,右列)上訓(xùn)練隨機(jī)森林模型一次。盡管訓(xùn)練組被減少了幾乎550個(gè)結(jié)構(gòu),但是當(dāng)單獨(dú)使用復(fù)合物結(jié)構(gòu)時(shí),q2和rmse值改善了。對(duì)于hl、lc2和dc,q2值大約是0.68,而hc1、lc1和lc2具有0.75以及以上的q2值(當(dāng)考慮復(fù)合物結(jié)構(gòu)時(shí))。備選地,為了確保在訓(xùn)練組中包括最大多樣性的不同取向的指紋,可以使用cd-hit來以100%同一性聚類取向指紋,以及針對(duì)每一個(gè)聚類,可以把至少一個(gè)代表添加到訓(xùn)練組中,直到把可得到的結(jié)構(gòu)分配給訓(xùn)練組為止??梢园哑溆嗟挠糜跍y試。由于試驗(yàn)組然后將會(huì)由也被包括在訓(xùn)練組中的取向指紋組成這樣的事實(shí),對(duì)于目前的數(shù)據(jù)組的,所產(chǎn)生q2值例如范圍從0.71到0.88,取決于各自的ab角參數(shù),當(dāng)面對(duì)未知的取向指紋時(shí),所述q2值將會(huì)夸大預(yù)測子的真實(shí)能力。在那種情況下,可能發(fā)現(xiàn)對(duì)于目前的數(shù)據(jù)集,q2值范圍大約為0.54至0.73。圖2顯示在單獨(dú)的復(fù)合物結(jié)構(gòu)數(shù)據(jù)集上,關(guān)于預(yù)測的對(duì)比真實(shí)的ab角參數(shù)的示范性的回歸圖。例如與由abhinandan和martin(4)報(bào)道的相比,相關(guān)性得到了改善。不受這種理論的限制,可以把所述的改善歸因于用六個(gè)ab角參數(shù)對(duì)vh-vl取向自由度的更精細(xì)的描述以及利用wolfguy編號(hào)方案減少或甚至避免了hvr殘基編號(hào)中的模糊度。在圖3中描繪了指紋位置作為不同的ab角參數(shù)的描述者的重要性排序。基于指紋位置重要性排序的發(fā)現(xiàn),已經(jīng)發(fā)現(xiàn)每一個(gè)ab角參數(shù)受vh和vl這兩者上的大體上不同組的界面位置影響。針對(duì)除hc2之外的所有參數(shù),構(gòu)架位置是最重要的描述符。盡管如此,在每一種情況下,至少兩個(gè)hvr-h3殘基在最重要的描述符之中。已經(jīng)在原始ab角公布(7)中被排序在頂部10個(gè)重要的輸入變量之中的位置也被推進(jìn)到本文中給出的排序中。但是,鑒于dunbar等人(7)發(fā)現(xiàn)hc1是排他地由重鏈上的殘基決定的,以及l(fā)c1是排他地由輕鏈上的殘基決定的,采用根據(jù)在本文中報(bào)道的方法確定的hc1和lc1的前十個(gè)描述符涉及這兩種鏈上的指紋位置。在本文中排序指紋位置不考慮氨基酸特異性。排序前25的指紋位置也包含由chailyan等人(5)(l41、l42、l43、l44)以及由abhinandan和martin(4)(l41、l44、l46、l87、h33、h45、h60、h62、h91、h105)鑒定的vh-vl取向決定位置組中的許多成員。已經(jīng)發(fā)現(xiàn)l87是hl的頂部描述符,l46是hc1的頂部描述符,h45是lc1的頂部描述符,h62是hc2的頂部描述符,以及l(fā)44是lc2的頂部描述符。采用vh-vl重取向的抗體同源性建模mofvab模型關(guān)于mofvab(抗體的fv的建模)方法的詳細(xì)說明已經(jīng)被bujotzek,a.等人公布(mabs7(2015)838-852)。獲得的關(guān)于建模變體1的結(jié)果(從在或者共有vh或者vl構(gòu)架上比對(duì),隨后在共有fv構(gòu)架上vh-vl重取向的模板結(jié)構(gòu)裝配的模型)被顯示在表6中。表6:采用mofvab變體1建立的amaii模型。數(shù)值陳述了在β-片層核心上進(jìn)行逐鏈比對(duì)以后,關(guān)于由teplyakov等人(7)所定義的片段的羰基rmsd。為了把由vh-vl取向中的偏差所引起的羰基位移考慮進(jìn)去,在完全的fv(vh和vl同時(shí))的β-片層核心上比對(duì)相同的模型并且重新計(jì)算所述的數(shù)值。將結(jié)果顯示在表7中。表7:采用mofvab變體1建立的amaii模型。數(shù)值陳述了在完全的fv的β-片層核心上進(jìn)行比對(duì)以后,關(guān)于由teplyakov等人(7)所定義的片段的羰基rmsd。最右邊的三列具體說明關(guān)于基于wolfguy片段定義和kabatcdr定義的構(gòu)架(fw)、hvr(cdr)和所有fv殘基(all)的羰基rmsd。在表6和表7之間的比較揭示了一旦考慮完全的fv結(jié)構(gòu),rmsd數(shù)值是怎么變壞的。對(duì)于vl,關(guān)于β-片層核心的平均羰基rmsd從增大到并且對(duì)于vh,從增大到這種趨勢不局限于構(gòu)架,而是延伸到hvr。例如對(duì)于hvr-l3,平均羰基rmsd從增大到而對(duì)于hvr-h3,從增大到通過直接地查看六個(gè)ab角參數(shù)和相對(duì)于參比結(jié)構(gòu)的差別,把在vh-vl取向方面的偏差顯示在表8中。表8:按照采用mofvab變體1建立的amaii模型的六個(gè)ab角參數(shù),在vh-vl取向相對(duì)于參比結(jié)構(gòu)的偏差。模型參比δhlδhc1δlc1δhc2δlc2δdcdistae角ab014ma3_b_a1.850.040.332.880.390.273.47ab014ma3_h_l7.722.460.074.510.780.039.31ab024kuz_h_l0.711.571.971.611.100.403.29ab034kq3_h_l1.710.190.952.450.270.103.15ab044kq4_h_l0.591.941.424.950.450.005.55ab054m6m_h_l8.843.903.304.170.320.3511.04ab064m6o_h_l3.731.610.000.540.510.284.14ab074mau_h_l2.602.333.870.382.280.235.71ab084m7k_h_l2.321.613.080.280.090.344.20ab094kmt_h_l2.470.982.083.821.360.055.28ab104m61_b_a0.630.251.154.561.600.205.02ab104m61_d_c0.980.700.315.520.940.295.74ab114m43_h_l2.392.154.382.251.330.356.042.811.521.762.920.880.225.53已經(jīng)使列在表8中的模型在相同的共有fv構(gòu)架上重取向并且因此共享基本上相同的大約θcons:=(-59.45,71.65,120.49,117.46,82.77,16.11)的ab角取向。顯示了amaii結(jié)構(gòu)固有的在vh-vl取向方面的大的多樣性。對(duì)于參數(shù)hl和hc2,發(fā)生的最大的偏差不僅在不同的結(jié)構(gòu)之間,而且也在來自相同的不對(duì)稱單元的序列相同的結(jié)構(gòu):4ma3_b_a和4ma3_h_l的參數(shù)hl偏差5.87度。這證實(shí)vh-vl取向雖然受某些序列特征引導(dǎo)(參見圖3),但是也受固有的、非定向的可變性影響。對(duì)于未結(jié)合形式的(7)結(jié)合蛋白的抗體,這是特別顯著的。采用建模變體2(從在或者共有vh或者vl構(gòu)架上比對(duì),隨后在基于與預(yù)測的ab角參數(shù)的相似度選擇的vh-vl取向模板結(jié)構(gòu)上進(jìn)行vh-vl重取向的模板結(jié)構(gòu)裝配的模型),利用的對(duì)模板結(jié)構(gòu)的相同選擇,重建了所有的模型。將結(jié)果顯示在表9中(數(shù)值涉及在完全的fv的β-片層核心上比對(duì)的模型-參比對(duì))。表9:采用mofvab變體2建立的amaii模型。針對(duì)vh-vl取向優(yōu)化的變體2模型計(jì)算的每個(gè)片段的平均羰基rmsd數(shù)值顯示了與利用一般的vh-vl取向的模型相比,大約的改善(參見表7)。ab角偏差揭示了變體2模型已經(jīng)移動(dòng)到更接近參比結(jié)構(gòu)的真實(shí)的vh-vl取向(參見表10)。表10:根據(jù)采用mofvab變體2建立的amaii模型的六個(gè)ab角參數(shù),相對(duì)于參比結(jié)構(gòu)在vh-vl取向方面的偏差。在最右邊的列中提供了基于預(yù)測的ab角參數(shù)選擇的vh-vl取向模板結(jié)構(gòu)。平均distab角從普通的取向模型的5.53改善到取向優(yōu)化的變化形式的4.78。在表的最右邊列中顯示的是基于加權(quán)的距離至預(yù)測的ab角參數(shù)選擇的vh-vl取向模板。不是基于指紋相似度而是通過在ab角取向空間方面的相似度來選擇vh-vl取向模板的。采用建模變體3,利用在常見的共有fv構(gòu)架而不是經(jīng)鏈的共有結(jié)構(gòu)上比對(duì)的模板結(jié)構(gòu),并且不以任何形式調(diào)整vh-vl取向,重建了所有的模型。由于經(jīng)fv比對(duì)了所有的模板結(jié)構(gòu)這樣的事實(shí),對(duì)于vl,逐鏈的羰基rmsd(參見表6)從0.37增大到0.43,而對(duì)于vh,從0.47增大到0.55(數(shù)據(jù)沒有被顯示)。在表11中列出了關(guān)于在完全的fv上比對(duì)的模型-參比對(duì)的羰基rmsd數(shù)值。表11:采用mofvab變體3建立的amaii模型。關(guān)于變體3的結(jié)果不像其它兩種變體的結(jié)果那樣好。盡管在變體3中混合了具有完全無關(guān)的vh-vl取向的來自fv結(jié)構(gòu)的模板片段,但是似乎對(duì)于模型品質(zhì)乎沒有特別地有害的影響。相應(yīng)的ab角偏差被顯示在表12中。表12:根據(jù)采用mofvab變體3建立的amaii模型的六個(gè)ab角參數(shù),在vh-vl取向相對(duì)于參比結(jié)構(gòu)方面的偏差。模型參比δhlδhc1δlc1δhc2δlc2δdcdistab角ab014ma3_b_a2.990.210.590.890.200.523.23ab014ma3_h_l2.882.290.990.740.590.283.94ab024kuz_h_l3.531.103.382.462.690.336.20ab034kq3_h_l3.630.542.224.811.030.246.53ab044kq4_h_l0.912.090.711.250.730.102.79ab054m6m_h_l9.762.803.220.932.760.0311.04ab064m6o_h_l5.951.511.500.380.920.176.40ab074mau_h_l2.392.452.970.763.110.545.57ab084m7k_h_l2.632.200.182.450.950.414.34ab094kmt_h_l3.250.112.320.550.180.114.04ab104m61_b_a0.920.393.260.410.080.293.45ab104m61_d_c0.570.842.421.370.740.383.08ab114m43_h_l0.941.912.771.421.580.234.103.101.422.041.421.200.284.98變體3模型的平均distab角不像vh-vl取向優(yōu)化的模型的那樣好,但是好于通過變體1產(chǎn)生的具有共有fv取向的模型的平均distab角。不受這種理論限制,取自在常見的共有fv構(gòu)架上比對(duì)的結(jié)構(gòu)的模板片段確實(shí)編碼一些vh-vl取向信息,不然這些信息將會(huì)丟失。上述顯示的所有數(shù)據(jù)涉及在存在對(duì)于所有殘基的位置限制的情況下被最小化的模型,除了被重塑或位于具有來源于不同模板結(jié)構(gòu)的相鄰殘基的片段邊緣處的那些模型以外。因此,保留了由模板結(jié)構(gòu)和/或vh-vl重取向所賦予的vh-vl取向信息的最大值。為了比較,重復(fù)所述的建模方法并且利用相同的力場和隱含的水模型組合(charmm和gbsw),同時(shí)省略位置限制,把所有的模型最小化。為了簡單起見,當(dāng)從受限制的轉(zhuǎn)換到完全柔性的最小化時(shí),僅僅總結(jié)了在羰基rmsd和distab角方面的平均變化。對(duì)于采用mofvab變體1和2建立的模型,相對(duì)于參比結(jié)構(gòu)的平均羰基rmsd變得稍微更大了。變體3模型,由于它們的模板結(jié)構(gòu)設(shè)置可能最受立體不準(zhǔn)確性的影響,受益于經(jīng)由小的邊緣的無限制的能量最小化。所有的三種模型變體在distab角方面相對(duì)于參比結(jié)構(gòu)有改善。不受這種理論限制,似乎是無限制的能量最小化誘導(dǎo)模型品質(zhì)相對(duì)于不同的建模變體(力場/隱含的水模型組合)的均等化。原始的amaii模型把通過使它在本文中所報(bào)道的vh-vl取向模板上重取向來改善給定的fv同源性模型的方法集成到本領(lǐng)域現(xiàn)有技術(shù)的建模軟件中。原始的amaii模型是從http://www.3dabmod.com中獲得的,采用wolfguy編號(hào)給所述的結(jié)構(gòu)注釋,為的是便于集成,并且所述的模型重取向在表8中所列的vh-vl取向模板上。在重取向以后每種抗體在羰基rmsd和distab角方面的平均變化(在所有amaii參與者各自的模型上求平均值),被顯示在圖5中。在十一組抗體模型(由所有通過根據(jù)ab02的acc、ccg、jef、joa、mmt、pig和sch提供的結(jié)構(gòu)構(gòu)成)中的八組的不同fv結(jié)構(gòu)(特別地沒有任何后加工)上進(jìn)行逐鏈重取向以后,完全的fv主鏈的羰基rmsd通過vh-vl重取向而得到改善。此外,模型組ab01、ab10和ab11在vh-vl取向和構(gòu)架rmsd方面改善了。最后,把所述的模型組分開,以便評(píng)估本文中所報(bào)道的vh-vl重取向方法與采用不同的方法建立的抗體模型在多大程度上一致。在重取向以后羰基rmsd和distab角方面的平均變化(在各自的amaii參與者的所有的模型上求平均值)被顯示在圖6中。對(duì)于所有參與者的模型,相對(duì)于參比結(jié)構(gòu),平均distab角得到了改善。在七種情形中的五種中,特別是關(guān)于構(gòu)架區(qū),由vh-vl重取向?qū)е碌膁istab角的減小轉(zhuǎn)變?yōu)楦玫膔msd數(shù)值。平均起來,發(fā)現(xiàn)對(duì)于整個(gè)fv,有distab角的顯著改善和羰基rmsd的小的改善。因此,正如在本文中報(bào)道的那樣,通過從單一的vh-vl堆積角移動(dòng)到根據(jù)由dunbar等人(7)定義的六個(gè)ab角參數(shù)的vh-vl取向的更精細(xì)描述,可以延伸基于序列特征的vh-vl取向預(yù)測概念。針對(duì)每一個(gè)ab角參數(shù),在迄今已知的fv結(jié)構(gòu)組上訓(xùn)練了隨機(jī)森林模型。當(dāng)在僅僅由復(fù)合物結(jié)構(gòu)組成的一組上訓(xùn)練時(shí),所述的六個(gè)預(yù)測子的q2值范圍從0.67到0.80。對(duì)我們的隨機(jī)森林模型的頂部描述符的分析揭示了許多以前沒有被知曉這樣的描述符的hvr-h3殘基。在本文中報(bào)道抗體編號(hào)方案“wolfguy”有助于鑒定這些殘基,因?yàn)樗辉O(shè)計(jì)成使得盡可能采用也(并且特別地)在高變區(qū)中的等效的指標(biāo)來給在結(jié)構(gòu)上等效的殘基編號(hào)。把沒有vh-vl取向預(yù)測和調(diào)節(jié)的兩種建模變體(變體1和3)與建模變體相比較,該建模變體根據(jù)六個(gè)ab角參數(shù)預(yù)測最可能的vh-vl取向,在抗體模板數(shù)據(jù)庫中自動(dòng)地搜索最相似地取向的fv結(jié)構(gòu),并且在進(jìn)一步加工之前,使原始模型在這種vh-vl取向模板上重取向(變體2)。將會(huì)預(yù)期:由于vh和vl的改善的預(yù)取向,相對(duì)于建模hvr-h3環(huán)的協(xié)同作用效果。而且,基于基于序列的預(yù)測子優(yōu)化vh-vl取向和隨后在模板結(jié)構(gòu)上的重取向的計(jì)算成本是微不足道的(例如當(dāng)與合成工作比較時(shí))。本發(fā)明已經(jīng)發(fā)現(xiàn):相對(duì)于抗原的親本非人抗體,在與抗原的相同表位結(jié)合的兩種(人源化的)抗體變體之間總的vh-vl取向差別與所述抗體各自在抗原結(jié)合能力方面的差別相關(guān)聯(lián)。在本文中從fv序列位置(“序列指紋”)的(有意義的)亞組中而不是從完全的fv序列中預(yù)測vh-vl取向?;谶@樣的假定:vh-vl取向由在vh-vl界面上或靠近vh-vl界面的殘基決定,已經(jīng)鑒定了一組界面殘基,其中如果在所述的數(shù)據(jù)庫中,例如在rab3d中,在至少90%的所有重疊的fv結(jié)構(gòu)中,一個(gè)殘基的側(cè)鏈原子以小于或等于的距離鄰接相反鏈的原子,則把所述殘基定義為vh-vl界面的一部分。將結(jié)果概括在表29中,該表也基于統(tǒng)計(jì)分析(4、5、7)陳述是否已經(jīng)預(yù)先將序列位置連接而使其成為vh-vl取向的決定簇。表29:vh-vl界面殘基,其中在rab3d中在至少90%的所有重疊的fv結(jié)構(gòu)中,如果一個(gè)殘基的側(cè)鏈原子以小于或等于的距離鄰接相反鏈的原子,則所述殘基是所述的界面的一部分。*根據(jù)環(huán)長度編號(hào)+根據(jù)chothia等人(13)所定義的vh-vl界面的一部分上述組的界面殘基丟失了一些序列位置,所述序列位置已經(jīng)被列在dunbar等人(7)的vh-vl取向的“頂部10個(gè)重要的輸入變量”之中。那些序列位置被列在下表30中。表30:被dunbar等人(7)列在vh-vl取向的“頂部10個(gè)重要的輸入變量”之中的另外的序列位置。*根據(jù)環(huán)長度編號(hào)+根據(jù)chothia等人(13)所定義的vh-vl界面的一部分為了選擇親本抗體的合適的(人源化的)變體抗體,根據(jù)vh和vl的六個(gè)“ab角”取向參數(shù)描述了vh-vl取向,所述的取向參數(shù)由一個(gè)扭轉(zhuǎn)角、四個(gè)彎曲角(每個(gè)可變域兩個(gè))以及中心軸長度組成。已經(jīng)發(fā)現(xiàn)可以使用在vh結(jié)構(gòu)域和vl結(jié)構(gòu)域之間的相對(duì)取向(vh-vl取向)來(預(yù)先)選擇具有最好的結(jié)合親和性的變體抗體。這可應(yīng)用在一組人源化的抗體內(nèi)部以及在一組人源化的抗體和親本非人抗體之間。此外,已經(jīng)發(fā)現(xiàn)每當(dāng)必須要改變(交換)構(gòu)架殘基或全部構(gòu)架時(shí),可以基于本文中所報(bào)道的方法來評(píng)估新的變體與它的抗原的結(jié)合。在下面采用具體的抗體來舉例說明本發(fā)明,這些抗體充當(dāng)實(shí)例而不應(yīng)該被解釋成用來把本發(fā)明的保護(hù)范圍限定于此。在本文中所報(bào)道的方法一般地是可應(yīng)用的方法。所述的序列指紋由54個(gè)氨基酸組成,29個(gè)在vh區(qū)中,以及25個(gè)在vl區(qū)中。參見下列的表13。表13:序列指紋。*根據(jù)環(huán)長度編號(hào)+根據(jù)chothia等人(13)所定義的vh-vl界面的一部分在第一個(gè)實(shí)例中,根據(jù)在本文中所報(bào)道的方法評(píng)估了與cd81受體胞外域(ecd)的大的胞外環(huán)(lel)結(jié)合的兩種鼠的抗體cd81k04和cd81k13以及其人源化的變體。在第二個(gè)實(shí)例中,根據(jù)在本文中所報(bào)道的方法評(píng)估了識(shí)別來自ptau蛋白(包括s422磷酸化)的肽段的兔抗體以及它的人源化的變體。在第三個(gè)實(shí)例中,根據(jù)在本文中所報(bào)道的方法評(píng)估了抗hepsin抗體以及它的人源化的變體。在序列比對(duì)中,采用灰色背景標(biāo)記hvr。所使用的hvr定義對(duì)應(yīng)于kabat和chothiacdr定義的并集。采用黑色背景來標(biāo)記作為用于預(yù)測vh-vl取向的序列指紋部分的序列位置。采用‘x’來標(biāo)記在給定的抗體中沒被占據(jù)的指紋位置。cd81k04、cd81k13(鼠的)和rb86的原始vh序列:cd81k04、cd81k13(鼠的)和rb86的原始vl序列:cd81k04vh人源化變體(原始的鼠的序列被顯示在頂部):cd81k04vl人源化變體(原始的鼠的序列被顯示在頂部):cd81k13vh人源化變體(原始的鼠的序列被顯示在頂部):cd81k13vl人源化變體(原始的鼠的序列被顯示在頂部):rb86vh人源化變體(原始的兔序列被顯示在頂部):fr3rftiskas--ttvdlkmtsptaedtgrftisrdnskntlylqmnslraedtarftisrdnskntlylqmnslraedtarftisrdnskntlylqmnslraedtarftisrds--ttlylqmnslraedtarftisrdnskntlylqmnslraedtarftisrdnskntlylqmnslraedtarftisrdnskntlylqmnslraedtarvtmttdtststaymelrslrsddtarvtmtkas--staymelrslrsddtarftisrdnskntlylqmnslraedtarftisrdnskntlylqmnslraedtarftisrdnskntlylqmnslraedtarftisrdnskntlylqmnslraedtarftisrdnskntlylqmnslraedtarftisrdnskntlylqmnslraedtarb86vl人源化變體(原始的兔序列被顯示在頂部):已經(jīng)利用一般的移植原理設(shè)計(jì)了序列變體。一般而言,發(fā)展了移植用來生產(chǎn)人源化的抗體。此外還可以使用移植來獲得與其它物種相容的抗體,或僅僅為了交換一種抗體的構(gòu)架以得到這種抗體或抗體片段的其它生物物理學(xué)性質(zhì)。在人恒定區(qū)對(duì)應(yīng)物上克隆人源化的可變區(qū)以后,通過把所有的重鏈質(zhì)粒與所有的輕鏈質(zhì)粒組合來以“矩陣”形式表達(dá)所述的抗體。于是第一行和第一列是半人源化的抗體,而第一單元格是呈它的嵌合形式的原始鼠或兔的抗體,以及矩陣的其余部分是完全人源化的抗體。關(guān)于抗cd81抗體cd81k04和cd81k13,結(jié)合數(shù)據(jù)是生物化學(xué)的(細(xì)胞的結(jié)合)elisa數(shù)據(jù),正如分別地在下面的表14和表15中概括的那樣。嵌合形式的cd81k04接近1.15的值,而人源化的變體是效力稍微更小的結(jié)合劑。對(duì)于一些變體,親和性下降得更加顯著。關(guān)于兔抗體rb86,在第一次針對(duì)它們的能力的篩選中分析了來自上清液的微純化物質(zhì),以獲得締合參數(shù)和解離參數(shù),其沒有偏離原始抗體的那些參數(shù)太多。針對(duì)每一種變體以及針對(duì)參比兔抗體,編輯了結(jié)合晚期(bl)ru(在締合階段結(jié)束時(shí)在spr/biacore實(shí)驗(yàn)中的應(yīng)答單位),以及解離常數(shù)kd[1/s],其可以被轉(zhuǎn)換為抗體在它的靶上的半衰期(t1/2=ln2/kd),分別參見表16和表17。對(duì)于一些締合非常差(在締合階段中ru接近于零或是負(fù)的)的變體,也沒有辦法測定kd值;將半衰期數(shù)值設(shè)定到0。在ab角距離和結(jié)合之間的相關(guān)性可以使用rv系數(shù)或其它系數(shù)例如來自protest方法的相關(guān)系數(shù)來關(guān)聯(lián)所述的矩陣。這些方法本質(zhì)上評(píng)估在兩個(gè)數(shù)據(jù)組之間的相關(guān)性,其中針對(duì)每一種樣品,我們不是有一個(gè)而是有幾個(gè)量度,并且因此在某種程度上延伸標(biāo)準(zhǔn)的單變量相關(guān)系數(shù)。rv系數(shù)被用在下列中。在表23中顯示了關(guān)于來自hc和lc的透視圖的三個(gè)不同的數(shù)據(jù)組的rv系數(shù)和它的p值。表23:關(guān)于全部四個(gè)數(shù)據(jù)組的rv系數(shù)和相應(yīng)的p值。rv系數(shù)是從作為樣品的hc以及因此作為多變量量度的lc中計(jì)算出來的,反之亦然。p值是經(jīng)由置換檢驗(yàn)計(jì)算出來的并且指示達(dá)到與計(jì)算出來的rv系數(shù)一樣高或比其高的rv系數(shù)的概率。關(guān)于所述的數(shù)據(jù)組的更少受限制的觀點(diǎn)將會(huì)要把每一種mab看作個(gè)體。在那種情況下,它使得把這兩個(gè)矩陣向量化和計(jì)算pearson相關(guān)性有意義。表24顯示關(guān)于不同的數(shù)據(jù)組的相關(guān)系數(shù)和相應(yīng)的p值。表24:關(guān)于所有的三個(gè)數(shù)據(jù)組的pearson相關(guān)系數(shù)和相應(yīng)的p值。計(jì)算了角度-距離和結(jié)合矩陣的向量化形式的相關(guān)性。所述的p值指示根據(jù)不具有相關(guān)性的零假設(shè)達(dá)到所計(jì)算的相關(guān)性的概率。所有的數(shù)據(jù)組顯示相關(guān)性。因此,已經(jīng)發(fā)現(xiàn)可以使用僅僅基于角度-距離來舍棄單個(gè)抗體的方法來選擇人源化的抗體變體??贵w亞組舍棄在下面分析了針對(duì)它們的表現(xiàn)的選擇抗體亞組的三種方法。這些方法是選擇最壞的20%、選擇壞的hc/lc組合和選擇本文中描述的完整hc或lc。為了評(píng)估不同的選擇方法的表現(xiàn),計(jì)算了不同的統(tǒng)計(jì)數(shù)字。第一種統(tǒng)計(jì)數(shù)字是在保留亞組和舍棄亞組之間中值結(jié)合長度的比率。關(guān)于這種比率,還利用置換檢驗(yàn)計(jì)算了p值。此外,使用堆積直方圖直觀地檢查了在所述的兩個(gè)亞組中結(jié)合長度的分布或一個(gè)數(shù)據(jù)組的ic50數(shù)值。cd81k04關(guān)于這兩種使用hc/lc信息的方法,必須選擇期望表現(xiàn)得差于其余者的hc/lc。圖7描繪關(guān)于hc(矩陣的行,左邊)和lc(矩陣的列,右邊)的平均角距離。把包含hc6、7、8、9、12、13和14以及l(fā)c7和9的抗體取消選擇了。在圖8中顯示了通過各自的選擇方法除去了哪些抗體以及保留了哪些抗體。表25顯示了針對(duì)它們的結(jié)合長度,比較所述的抗體亞組的結(jié)果。計(jì)算了在這兩個(gè)組中的中值結(jié)合長度并且形成了這兩者的比率。在該表中顯示了所有的三種方法連同p值的結(jié)果,其指示得到至少這種低的比率的概率。表25:關(guān)于這三種不同的抗體舍棄法,計(jì)算了在舍棄的抗體和保留的抗體之間中值酶聯(lián)免疫吸附測定測量值的比率。另外經(jīng)由置換法計(jì)算了p值,其顯示達(dá)到與所發(fā)現(xiàn)的中值比率一樣低或更低的值的概率。cd81k04中值比率(取消選擇的/選擇的)p值舍棄最壞的20%0.22790.0373舍棄壞的hc/lc組合0.206610.0162舍棄全部hc和lc0.3152<0.001不依賴于所述的方法,保留的抗體亞組具有比取消選擇的抗體長3-5倍的結(jié)合長度。此外,這些結(jié)果是顯著的(p<0.05)。在圖9中顯示了關(guān)于所述的三種選擇方法的elisa測量值的堆積直方圖。該直方圖證實(shí)了中值比率結(jié)果。所有的三種方法都舍棄低結(jié)合的單克隆抗體。cd81k13對(duì)于抗體cd81k13的人源化的變體,進(jìn)行了與上面所描繪的相同的方法。將結(jié)果顯示在圖10至12以及下表26中。取消選擇了包含hc3、4和9以及l(fā)c2、5、6、7、10和11的抗體。所有這三種方法導(dǎo)致一個(gè)亞組的結(jié)合比取消選擇亞組中抗體的長1.6-2倍(參見表26)。表26:關(guān)于這三種不同的抗體選擇方法,計(jì)算了在舍棄的抗體和保留的抗體之間中值elisa測量值的比率。另外經(jīng)由置換法計(jì)算了p值,其顯示達(dá)到與所發(fā)現(xiàn)的中值比率一樣低或更低的值的概率。圖12顯示具有較低的結(jié)合長度的多數(shù)抗體被舍棄了。rb86為抗體rb86的人源化變體進(jìn)行了與上面描繪的一樣的方法。結(jié)果被顯示在圖13至15以及下列表27中。取消選擇了包含hc9、10和11以及l(fā)c2和8的抗體。關(guān)于抗體rb86的變體,在選擇/取消選擇步驟中使用了spr數(shù)據(jù)。能夠得到關(guān)于不同抗體的結(jié)合行為的兩種不同的量度。基于bl數(shù)據(jù),取消選擇了不同的抗體(參見圖14)。所有三種選擇方法都針對(duì)“bl”選擇平均結(jié)合好3-5.5倍的抗體。p值指示結(jié)果不是偶然的,而是由于在所述的不同方法中用來選擇抗體的有利的方式所致。表27:關(guān)于這三種不同的抗體舍棄法,計(jì)算了在舍棄的抗體和保留的抗體之間中值bl測量值的比率。另外經(jīng)由置換法計(jì)算了p值,其顯示達(dá)到與所測定的中值比率一樣低或更低的值的概率。這在圖15中是帶下劃線的,其中堆積直方圖顯示具有低的結(jié)合長度的抗體主要地被取消選擇了。作為基于t1/2數(shù)據(jù)的備選方法,取消選擇了抗體(參見圖16)。正如可以看到的那樣,如基于bl數(shù)據(jù)那樣選擇了相同的抗體。關(guān)于不同的選擇方法的中值比率顯示:被取消選擇的抗體亞組總是差于被保留的亞組(參見表28)。采用“壞的hc/lc組合”方法,僅僅取消選擇了少數(shù)幾種抗體,但是在所述的組中有許多不具有半衰期的抗體。這是為什么關(guān)于這種方法的p值不是顯著的理由。關(guān)于其它方法,p值指示很好地選擇了被取消選擇的亞組。表28:關(guān)于這三種不同的抗體選擇方法,計(jì)算了在取消選擇的抗體和選擇抗體之間中值t1/2測量值的比率。另外經(jīng)由置換法計(jì)算了p值,其顯示達(dá)到與所測定的中值比率一樣低或更低的值的概率。在圖17中的堆積直方圖中也顯示了這一點(diǎn)。所有的方法都取消選擇了大量的具有很低的半衰期的許多抗體。概述已經(jīng)發(fā)現(xiàn):當(dāng)把vh-vl取向(vh-vl角度)預(yù)測應(yīng)用在全部來源于常見的原始親本抗體的人源化變體上時(shí),良好的人源化的變體更加緊密地遵從親本抗體的角度參數(shù)。所述的被用于舍棄具有次優(yōu)vh-vl取向的抗體,即舍棄“最壞的20%”或一組全部hc/lc或壞的hc/lc組合的三種方法,產(chǎn)生了類似的抗體亞組。堆積直方圖和相關(guān)性分析證實(shí):角度-距離是結(jié)合行為的良好指標(biāo)。已經(jīng)發(fā)現(xiàn)通過利用在本文中所報(bào)道的選擇方法,可以急速地增大這樣過濾的人源化矩陣的品質(zhì)。在一種實(shí)施方式中,插入置信度矩陣作為另外的步驟,例如首先選擇被取消選擇的亞組,然后選擇高置信度亞組。在一種實(shí)施方式中,使用所有的抗體之間的距離信息來計(jì)算抗體聚類并且鑒定距離插入?yún)⒈鹊木垲愖钸h(yuǎn)的抗體聚類。具體的實(shí)施方式1.用于篩選來源于親本抗體fv片段的一種或更多種變體抗體fv片段的方法,其包括下列步驟:-通過把來自親本抗體fv片段的一個(gè)或更多個(gè)決定結(jié)合特異性的殘基移植/轉(zhuǎn)移到受體抗體fv片段上而產(chǎn)生許多變體抗體fv片段,由此所述的許多變體抗體fv片段的每一種變體抗體fv片段與其它變體抗體fv片段至少有一個(gè)氨基酸殘基不同,-基于所述的抗體fv片段的序列指紋,確定親本fv片段和所述的許多變體抗體fv片段中的每一種變體抗體fv片段的vh-vl取向,-選擇在vh-vl取向方面與親本抗體的vh-vl取向比較具有最小差別的那些變體抗體fv片段并且從而選擇一種或更多種來源于親本抗體fv片段的變體抗體fv片段,由此所述的一種或更多種變體抗體fv片段與親本抗體fv片段與相同的抗原結(jié)合。2.用于把非人抗體人源化的方法,其包括下列步驟:-提供與抗原特異性地結(jié)合的非人抗體,-通過把來自非人抗體的一個(gè)或更多個(gè)決定結(jié)合特異性的殘基移植/轉(zhuǎn)移到人或人源化的受體抗體或種系抗體序列上產(chǎn)生許多變體抗體,由此所述的許多變體抗體中的每一種變體抗體與其它變體抗體至少有一個(gè)氨基酸殘基不同,-基于所述的抗體fv片段的序列指紋,確定非人抗體fv片段和所述的許多變體抗體中的每一種變體抗體的fv片段的vh-vl取向,-選擇在vh-vl取向方面與親本抗體的vh-vl取向比較具有最小差別的那些變體抗體fv片段并且從而選擇來源于非人的一種或更多種人源化的抗體,由此所述的一種或更多種人源化的抗體與非人抗體與相同的抗原結(jié)合。3.根據(jù)實(shí)施方式1所述的方法,其包括下列步驟:-選擇在vh-vl域間角方面與親本抗體的vh-vl域間角比較具有最高的(結(jié)構(gòu)上的)相似度的那些變體抗體fv片段并且從而選擇一種或更多種來源于親本抗體fv片段的變體抗體fv片段。4.根據(jù)實(shí)施方式2所述的方法,其包括下列步驟:-選擇在vh-vl域間角方面與親本抗體的vh-vl域間角比較具有最高的(結(jié)構(gòu)上的)相似度的那些變體抗體fv片段并且從而選擇一種或更多種來源于非人抗體的人源化的抗體。5.根據(jù)實(shí)施方式1和3中任意一種所述的方法,其中所述的親本抗體fv片段是非人抗體fv片段。6.根據(jù)實(shí)施方式1、3和5中任意一種所述的方法,其中所述的受體抗體fv片段是人或人源化的抗體fv片段或人抗體fv片段種系氨基酸序列。7.根據(jù)實(shí)施方式1至6中任意一種所述的方法,其中所述的序列指紋是一組vh-vl界面殘基。8.根據(jù)實(shí)施方式7所述的方法,其中vh-vl界面殘基是氨基酸殘基,其側(cè)鏈原子以小于或等于的距離鄰接相反鏈的原子(在至少90%的所有重疊的fv結(jié)構(gòu)中)。9.根據(jù)實(shí)施方式7至8中任意一種所述的方法,其中所述組的vh-vl界面殘基包括殘基l44、l46、l87、h45、h62(根據(jù)chothia指標(biāo)編號(hào))。10.根據(jù)實(shí)施方式7至9中任意一種所述的方法,其中所述組的vh-vl界面殘基包括殘基h35、h37、h39、h45、h47、h50、h58、h60、h61、h91、h95、h96、h98、h100x-2、h100x-1、h100x、h101、h102、h103、h105、l32、l34、l36、l38、l43、l44、l46、l49、l50、l55、l87、l89、l91、l95x-1、l95x、l96(根據(jù)chothia指標(biāo)編號(hào))。11.根據(jù)實(shí)施方式7至9中任意一種所述的方法,其中所述組的vh-vl界面殘基包括殘基h33、h35、h43、h44、h46、h50、h55、h56、h58、h61、h62、h89、h99、l34、l36、l38、l41、l42、l43、l44、l45、l46、l49、l50、l53、l55、l56、l85、l87、l89、l91、l93、l94/l95x-1、l95x、l96、l97、l100(根據(jù)chothia指標(biāo)編號(hào))。12.根據(jù)實(shí)施方式7至9中任意一種所述的方法,其中所述組的vh-vl界面殘基包括殘基h33、h35、h37、h39、h43、h44、h45、h46、h47、h50、h55、h56、h58、h60、h61、h62、h89、h91、h95、h96、h9r、h99、h100x-2、h100x-1、h100x、h101、h102、h103、h105、l32、l34、l36、l38、l41、l42、l43、l44、l45、l46、l49、l50、l53、l55、l56、l85、l87、l89、l91、l93、l94/l95x-1、l95x、l96、l97、l100(根據(jù)chothia指標(biāo)編號(hào))。13.根據(jù)實(shí)施方式7至9中任意一種所述的方法,其中所述組的vh-vl界面殘基包括殘基h35、h37、h39、h45、h47、h50、h58、h60、h61、h91、h95、h96、h98、h100x-2、h100x-1、h100x、h101、h102、h103、h105、l32、l34、l36、l38、l43、l44、l46、l49、l50、l55、l87、l89、l91、l95x-1、l95x、l96、l98(根據(jù)chothia指標(biāo)編號(hào))。14.根據(jù)實(shí)施方式7至9中任意一種所述的方法,其中所述組的vh-vl界面殘基包括殘基h33、h35、h37、h39、h43、h44、h45、h46、h47、h50、h55、h56、h58、h60、h61、h62、h89、h91、h95、h96、h98、h99、h100x-2、h100x-1、h100x、h101、h102、h103、h105、l32、l34、l36、l38、l41、l42、l43、l44、l45、l46、l49、l50、l53、l55、l56、l85、l87、l89、l91、l93、l94/l95x-1、l95x、l96、l97、l98、l100(根據(jù)chothia指標(biāo)編號(hào))。15.根據(jù)實(shí)施方式7至8中任意一種所述的方法,其中所述組的vh-vl界面殘基包括殘基210、296、610、612、733(根據(jù)wolfguy指標(biāo)編號(hào))。16.根據(jù)實(shí)施方式7至8和15中任意一種所述的方法,其中所述組的vh-vl界面殘基包括殘基199、202、204、210、212、251、292、294、295、329、351、352、354、395、396、397、398、399、401、403、597、599、602、604、609、610、612、615、651、698、733、751、753、796、797、798(根據(jù)wolfguy指標(biāo)編號(hào))。17.根據(jù)實(shí)施方式7至8和15至16中任意一種所述的方法,其中所述組的vh-vl界面殘基包括殘基197、199、208、209、211、251、2r9、290、292、295、296、327、355、599、602、604、607、608、609、610、611、612、615、651、696、698、699、731、733、751、753、755、796、797、798、799、803(根據(jù)wolfguy指標(biāo)編號(hào))。18.根據(jù)實(shí)施方式7至8和15至17中任意一種所述的方法,其中所述組的vh-vl界面殘基包括殘基197、199、202、204、208、209、210、211、212、251、292、294、295、296、327、329、351、352、354、355、395、396、397、398、399、401、403、597、599、602、604、607、608、609、610、611、612、615、651、696、698、699、731、733、751、753、755、796、796、797、798、799、801、803(根據(jù)wolfguy指標(biāo)編號(hào))。19.根據(jù)實(shí)施方式7至8和15至18中任意一種所述的方法,其中所述組的vh-vl界面殘基包括殘基199、202、204、210、212、251、292、294、295、329、351、352、354、395、396、397、398、399、401、403、597、599、602、604、609、610、612、615、651、698、733、751、753、796、797、798、801(根據(jù)wolfguy指標(biāo)編號(hào))。20.根據(jù)實(shí)施方式7至8和15至19中任意一種所述的方法,其中所述組的vh-vl界面殘基包括殘基197、199、202、204、208、209、210、211、212、251、292、294、295、296、327、329、351、352、354、355、395、396、397、398、399、401、403、597、599、602、604、607、608、609、610、611、612、615、651、696、698、699、731、733、751、753、755、796、796、797、798、799、801、803(根據(jù)wolfguy指標(biāo)編號(hào))。21.根據(jù)實(shí)施方式1至20中任意一種所述的方法,其包括選擇預(yù)部20%變體抗體fv片段。22.根據(jù)實(shí)施方式1至21中任意一種所述的方法,其中通過計(jì)算六個(gè)ab角vh-vl取向參數(shù)來確定vh-vl取向。23.根據(jù)實(shí)施方式1至22中任意一種所述的方法,其中通過利用隨機(jī)的森林方法計(jì)算ab角vh-vl取向參數(shù)來確定vh-vl取向。24.根據(jù)實(shí)施方式1至23中任意一種所述的方法,其中通過利用隨機(jī)的森林方法為每一個(gè)ab角計(jì)算ab角vh-vl取向參數(shù)來確定vh-vl取向。25.根據(jù)實(shí)施方式1至24中任意一種所述的方法,其中通過利用隨機(jī)森林模型計(jì)算vh和vl的慣常的扭轉(zhuǎn)角、四個(gè)彎曲角(每個(gè)可變域兩個(gè))和中心軸長度(hl、hc1、lc1、hc2、lc2、dc)來確定vh-vl取向。26.根據(jù)實(shí)施方式25所述的方法,其中僅僅采用復(fù)合物抗體結(jié)構(gòu)數(shù)據(jù)來訓(xùn)練隨機(jī)森林模型。27.根據(jù)實(shí)施方式1至26中任意一種所述的方法,其中所述的最小差別是最高的q2值。28.根據(jù)實(shí)施方式1至27中任意一種所述的方法,其中最高的結(jié)構(gòu)相似度是最低的平均均方根偏差(rmsd)。29.根據(jù)實(shí)施方式1至28中任意一種所述的方法,其中使用從在或者共有vh或者vl構(gòu)架上比對(duì)的結(jié)構(gòu)模板裝配,隨后在共有fv構(gòu)架上進(jìn)行vh-vl重取向的模型來確定vh-vl取向。30.根據(jù)實(shí)施方式1至28中任意一種所述的方法,其中使用在完全的fv(vh和vl同時(shí))的β-片層核心上比對(duì)的模型來確定vh-vl取向。31.根據(jù)實(shí)施方式1至30中任意一種所述的方法,其中使用其中在共有fv構(gòu)架上使抗體fv片段重取向的模型來確定vh-vl取向。32.根據(jù)實(shí)施方式1至28和30中任意一種所述的方法,其中使用利用在常見的共有fv構(gòu)架上比對(duì)的模板結(jié)構(gòu)并且不以任何形式調(diào)整vh-vl取向的模型來確定vh-vl取向。33.根據(jù)實(shí)施方式1至28和30中任意一種所述的方法,其中使用從在或者共有vh或者vl構(gòu)架上比對(duì)的模板結(jié)構(gòu)裝配,隨后在基于相似度選擇的vh-vl取向模板結(jié)構(gòu)上進(jìn)行vh-vl重取向的模型來確定vh-vl取向。34.用于生產(chǎn)抗體的方法,其包括下列步驟:-按照根據(jù)實(shí)施方式1至33中任意一種所述的方法選擇一種或更多種抗體或抗體fv片段,-基于它的結(jié)合性質(zhì),從所述的一種或更多種抗體或抗體fv片段中選擇單一的抗體或抗體fc片段,-把編碼vh和vl的核酸克隆到一種或更多種表達(dá)載體中,-采用在前一步驟中獲得的表達(dá)載體轉(zhuǎn)染細(xì)胞,-培養(yǎng)所轉(zhuǎn)染的細(xì)胞并且從而生產(chǎn)所述的抗體。下列是本發(fā)明的方法和組合物的實(shí)施例。應(yīng)該明白:鑒于上面提供的一般說明的情況下,各種其它的實(shí)施方式都可以被實(shí)施。不要把所述的實(shí)施例理解成用來限定本發(fā)明。真實(shí)的保護(hù)范圍是在權(quán)利要求中給出的。實(shí)施例實(shí)施例1材料和方法roche抗體數(shù)據(jù)庫3d(rab3d)抗體結(jié)構(gòu)數(shù)據(jù)庫rab3d包含大部分可公開地得到的fv結(jié)構(gòu)。采用內(nèi)部的“wolfguy”編號(hào)方案(參見下一部分)加工和注釋fv結(jié)構(gòu)。把所有注釋的fv結(jié)構(gòu)疊加在共有fv構(gòu)架上、疊加在共有vh構(gòu)架上和疊加在共有vl構(gòu)架上。利用來自pdb的高分辨結(jié)構(gòu)亞組計(jì)算共有結(jié)構(gòu)。注釋和重取向的fv結(jié)構(gòu)充當(dāng)同源性建模的模板倉庫。wolfguy編號(hào)方案wolfguy編號(hào)把cdr區(qū)定義為kabat和chothia定義的并集。此外,所述的編號(hào)方案基于cdr長度(以及部分地基于序列)注釋cdr環(huán)尖端,使得cdr位置指標(biāo)指示cdr殘基是否是上升或下行環(huán)的一部分。在下面表1中顯示了與已確立的編號(hào)方案的比較。表1:使用chothia/kabat(ch-kb)、honegger和wolfguy編號(hào)方案給cdr-l3和cdr-h3編號(hào)。后一種編號(hào)方案具有從n端堿基到cdr峰遞增的編號(hào)以及從c端cdr末端開始遞減的編號(hào)。kabat方案固定最后兩個(gè)cdr殘基并且引入多個(gè)字母以適應(yīng)cdr長度。與kabat命名法對(duì)比,honegger編號(hào)不使用字母并且對(duì)于vh和vl是常見的。這樣設(shè)計(jì)wolfguy,使得盡可能采用等效的指標(biāo)來給在結(jié)構(gòu)上等效的殘基(即在fv結(jié)構(gòu)中在保守性空間定位方面非常相似的殘基)編號(hào)。在圖1中舉例說明了這一點(diǎn)。在下面表2中可以找到wolfguy編號(hào)的全長vh和vl序列的實(shí)例。表2:采用wolfguy、kabat和chothia編號(hào)的具有pdbid3pp4(21)的晶體結(jié)構(gòu)的vh(左邊)和vl(右邊)序列。在wolfguy中,僅僅依靠長度給cdr-hi-h3、cdr-l2和cdr-l3編號(hào),同時(shí)依靠環(huán)長度和正則簇成員資格給cdr-l1編號(hào)。通過計(jì)算與不同的共有序列的序列相似度來確定正則簇成員資格。在這里,我們僅僅提供關(guān)于cdr-l1編號(hào)的單個(gè)實(shí)例,因?yàn)樗鼘?duì)于產(chǎn)生我們的vh-vl取向序列指紋是不重要的。實(shí)施例1vh-vl取向指紋選擇在本文中從fv序列位置(“序列指紋”)的(有意義的)亞組中而不是從完全的fv序列中預(yù)測vh-vl取向。基于這樣的假定:vh-vl取向由在vh-vl界面上或靠近vh-vl界面的殘基決定,已經(jīng)鑒定了一組界面殘基,其中如果在所述的數(shù)據(jù)庫中,例如在rab3d中,在至少90%的所有重疊的fv結(jié)構(gòu)中,一個(gè)殘基的側(cè)鏈原子以小于或等于的距離鄰接相反鏈的原子,則把它定義為vh-vl界面的一部分。將結(jié)果概括在表29中,該表也基于統(tǒng)計(jì)分析(4、5、7)陳述是否已經(jīng)預(yù)先將序列位置連接而使其成為vh-vl取向的決定簇。表29:vh-vl界面殘基,其中在rab3d中在至少90%的所有重疊的fv結(jié)構(gòu)中,如果一個(gè)殘基的側(cè)鏈原子以小于或等于的距離鄰接相反鏈的原子,則它是所述的界面的一部分。*根據(jù)環(huán)長度編號(hào)+根據(jù)chothia等人(13)所定義的vh-vl界面的一部分上述組的界面殘基丟失了一些被dunbar等人(7)列在關(guān)于vh-vl取向的“頂部10個(gè)重要的輸入變量”之中的序列位置。那些序列位置被列在下列表30中。表30:被dunbar等人(7)列在vh-vl取向的“頂部10個(gè)重要的輸入變量”之中的另外的序列位置。*根據(jù)環(huán)長度編號(hào)+根據(jù)chothia等人(13)所定義的vh-vl界面的一部分從這個(gè)可能的vh-vl取向決定序列位置集合中,裝配了三種序列指紋用于統(tǒng)計(jì)學(xué)評(píng)價(jià):指紋1包含已經(jīng)被發(fā)現(xiàn)是vh-vl界面的一部分的所有的序列位置,正如在表29中所陳述的那樣,第801位(l98)鑒于它們高度的序列保守性而被拋棄。指紋2包含所有的列在ab角的“頂部10個(gè)重要的輸入變量”(7)之中的序列位置,即197、199、208、209、211、251、292、295、296、327、355、599、602、604、607、608、609、610、611、612、615、651、696、698、699、731、733、751、753、755、796、797、798、799、803(h33、h35、h43、h44、h46、h50、h58、h61、h62、h89、h99、l34、l36、l38、l41、l42、l43、l44、l45、l46、l49、l50、l53、l55、l56、l85、l87、l89、l91、l93、l94/l95x-1、l95x、l96、l97、l100)以及第289和290位(h55和h56)。指紋3是指紋1和指紋2的并集。為了評(píng)估僅僅基于構(gòu)架序列預(yù)測vh-vl取向可能到什么程度,我們針對(duì)所述的三種指紋中的每一種生產(chǎn)了兩種減小的變體,即a:僅僅具有處于構(gòu)架邊緣的最外面的cdr殘基,和b:沒有任何cdr殘基。實(shí)施例2vh-vl取向預(yù)測子訓(xùn)練積累了到2013年10月為止來自rcsbpdb(www.rcsb.org)(24)的可公開地得到的抗體fv晶體結(jié)構(gòu),并且對(duì)于每一種結(jié)構(gòu),按照本文中描述的那樣計(jì)算ab角vh-vl取向(參見實(shí)施例4)。此外,正如上面舉例說明的那樣,對(duì)于每一種結(jié)構(gòu)產(chǎn)生了vh-vl取向序列指紋(在序列中黑色高亮顯示)。所述的序列指紋由54個(gè)氨基酸組成,29個(gè)在vh區(qū)中,以及25個(gè)在vl區(qū)中。所述的序列指紋也包含屬于高變區(qū)的殘基,取決于環(huán)長度,這些殘基可能不存在于給定的抗體序列中。在這種情況下,采用‘x’而不是呈單字母密碼的規(guī)則的氨基酸描述來指示未被占據(jù)的序列指紋位置。在已經(jīng)計(jì)算了ab角參數(shù)以及序列指紋這兩者以后,把數(shù)據(jù)集(n=2249)分類成復(fù)合物結(jié)構(gòu)(n_complex=1468)和apo(n_apo=781)結(jié)構(gòu)。所述的“隨機(jī)的森林”方法結(jié)果是每一個(gè)ab角取向參數(shù)的統(tǒng)計(jì)學(xué)上顯著最好的預(yù)測子,隨后是“神經(jīng)網(wǎng)絡(luò)”和“決策樹”。方法“提高樹”在我們的數(shù)據(jù)集上表現(xiàn)得最不好(沒有顯示數(shù)據(jù))。對(duì)于每一個(gè)ab角參數(shù),每一個(gè)參數(shù)進(jìn)行了50次運(yùn)行(每一次運(yùn)行由訓(xùn)練階段和測試階段組成),同時(shí)在所述的隨機(jī)森林中從10到100改變決策樹的數(shù)目,以確定關(guān)于試驗(yàn)組的q2值的最佳的樹數(shù)目。對(duì)于每一個(gè)單次運(yùn)行,把輸入數(shù)據(jù)集隨機(jī)地分成70%訓(xùn)練組和30%試驗(yàn)組。使用accelryspipelinepilot8.5(19)采用組件“學(xué)習(xí)rp(隨機(jī)分配)森林模型”以“回歸”模式實(shí)施隨機(jī)森林模型。在表31中列出了森林模型的參數(shù)設(shè)置的列表。表31:關(guān)于在accelryspipelinepilot8.5中使用“學(xué)習(xí)rp(隨機(jī)分配)森林模型”組件的回歸的參數(shù)設(shè)置。表32顯示采用隨機(jī)地選擇的訓(xùn)練和試驗(yàn)組在50次運(yùn)行上平均化的六個(gè)ab角參數(shù)的預(yù)測值的q2和均方根誤差值(rmse)。表32:用于預(yù)測在50次運(yùn)行上平均化的六個(gè)ab角參數(shù)的q2和rmse值。手動(dòng)調(diào)整每個(gè)隨機(jī)森林模型的樹的數(shù)目,以便使o2最大化。在括弧中的數(shù)值具體說明標(biāo)準(zhǔn)差。在apo和復(fù)合物結(jié)構(gòu)(表32,中心列)的完全數(shù)據(jù)集上訓(xùn)練了隨機(jī)森林模型一次以及在單獨(dú)的復(fù)合物結(jié)構(gòu)(上面的表32,右邊的列)上訓(xùn)練隨機(jī)森林模型一次。盡管使訓(xùn)練組減少了將近550個(gè)結(jié)構(gòu),但是當(dāng)考慮單獨(dú)的復(fù)合物結(jié)構(gòu)時(shí),q2和rmse值改善了。對(duì)于hl、lc2和dc,q2值是大約0.68,同時(shí)hc1、lc1和lc2具有0.75以及以上(當(dāng)考慮復(fù)合物結(jié)構(gòu)時(shí))的q2值。圖2顯示關(guān)于在單獨(dú)的復(fù)合物結(jié)構(gòu)數(shù)據(jù)集上預(yù)測的對(duì)比真實(shí)的ab角參數(shù)的示例性的回歸圖。進(jìn)一步評(píng)估了確認(rèn)組的大小(數(shù)據(jù)集的或者1/3或者1/2)是否對(duì)隨機(jī)的森林預(yù)測有影響。關(guān)于所有的ab角參數(shù),已經(jīng)發(fā)現(xiàn):正如將要預(yù)期的那樣,在r2方面的差別有利于較小的確認(rèn)組和較大的訓(xùn)練組(沒有顯示數(shù)據(jù))。最后,經(jīng)過三次重復(fù)后,評(píng)估了三種指紋和它們的減小的變體對(duì)六個(gè)不同的ab角參數(shù)的預(yù)測表現(xiàn)(參見表33)。表33:使用所述的三種序列指紋和它們的僅僅在構(gòu)架的邊緣處具有最外面的cdr殘基(a)和沒有任何cdr殘基(b)的變體,經(jīng)過三次重復(fù)后,預(yù)測六個(gè)ab角參數(shù)hl、hc1、lc1、hc2、lc2和dc的平均r2值?;诮缑鏆埢M的指紋1和基于ab角頂部輸入變量位置的指紋2同樣地好,當(dāng)組合時(shí),這兩種(指紋3)似乎既不賦予另外的預(yù)測功效也不損害結(jié)果。在所有的三種情形中,所述的兩種減小的指紋變體表現(xiàn)更差,這證實(shí)單獨(dú)的構(gòu)架序列信息不足以確定vh-vl結(jié)構(gòu)域取向。指紋3被選擇用于進(jìn)一步評(píng)估以及隨機(jī)森林模型被選擇用于學(xué)習(xí)。為了把預(yù)測組件摻入同源性建模解決方案中,使用具有組件“學(xué)習(xí)rp(隨機(jī)分配)森林模型”的accelryspipelinepilot8.5(19),以“回歸”模式實(shí)施和訓(xùn)練隨機(jī)森林模型。針對(duì)可在rab3d中得到的所有的fv結(jié)構(gòu)(n=2249),計(jì)算了ab角vh-vl取向參數(shù)以及指紋3,并且把所述的數(shù)據(jù)集的成員分類到復(fù)合物(n=1468)和apo(n=781)結(jié)構(gòu)中。對(duì)于每一個(gè)ab角參數(shù),每一個(gè)進(jìn)行50次運(yùn)行,同時(shí)從10到100改變所述的隨機(jī)森林中決策樹的數(shù)目,以便針對(duì)試驗(yàn)組的q2值,確定最佳的樹數(shù)目。對(duì)于每一次單次運(yùn)行,把輸入數(shù)據(jù)集隨機(jī)地分成70%試驗(yàn)組和30%訓(xùn)練組。實(shí)施例3具有vh-vl取向調(diào)節(jié)的抗體同源性建模算法用于給抗體的fv區(qū)建模的建模軟件(mofvab)使用注釋的并重取向的結(jié)構(gòu),例如來自rab3d數(shù)據(jù)庫,作為模板倉庫。采用wolfguy為給定的一對(duì)重和輕鏈輸入序列注釋并且分別地將其簡化為vh和vl。然后將vh和vl這兩者分成七個(gè)功能段,即構(gòu)架1、cdr1、構(gòu)架2、cdr2、構(gòu)架3、cdr3和構(gòu)架4(參見表10)。與其它同源性建模方法對(duì)比,沒有依照fv或依照鏈來選擇常見的構(gòu)架模板,而是基于序列同源性獨(dú)立地檢索/比對(duì)/確定每個(gè)片段。例如可以從十四個(gè)不同的模板結(jié)構(gòu)以及可能甚至更多的模板結(jié)構(gòu)裝配單個(gè)mofvab模型,因?yàn)閺牟煌哪0褰Y(jié)構(gòu)重建cdr環(huán)的上行和下行部分也是可行的。按照以下順序給片段模板命中排序:1)序列相似度(blosum62矩陣得分),2)不完全側(cè)鏈的數(shù)目3)模板結(jié)構(gòu)的分辨率,和4)模板結(jié)構(gòu)對(duì)比rab3d共有構(gòu)架的比對(duì)rmsd。任選地,有可能通過從頭區(qū)段來增大(或甚至整體替換)針對(duì)給定片段的可利用的模板選擇。在常見的共有構(gòu)架上比對(duì)所有的模板結(jié)構(gòu),因此所有的模板結(jié)構(gòu)共享相同的坐標(biāo)系。這樣,把模板坐標(biāo)轉(zhuǎn)移到原始模型文件而沒有進(jìn)一步調(diào)整。然后加工原始模型:交換非同源的側(cè)鏈,重塑不完全的模板側(cè)鏈,以及通過旋轉(zhuǎn)異構(gòu)體最優(yōu)化來消除空間上的沖突。由于獨(dú)立地選擇每一個(gè)片段這一事實(shí),每個(gè)模型必需的側(cè)鏈交換的數(shù)目是能夠控制的。針對(duì)charmm力場把加工模型參數(shù)化并且使用具有簡單變換的generalizedborn(gbsw)隱含的水模型,首先通過最陡下行,然后通過共軛梯度法,使加工模型最小化。為了保留最大量的來自模板結(jié)構(gòu)的構(gòu)象信息,在所述的最小化期間限制所有的還沒有被重塑以及不是位于片段邊緣(具有起源于不同模板結(jié)構(gòu)的相鄰殘基)的殘基?;谑褂胊ccelrysdiscoverystudio3.5(20)界面的在accelryspipelinepilot8.5(19)中實(shí)施的方案,mofvab作為網(wǎng)絡(luò)服務(wù)是可以利用的。比較了三種mofvab建模變體以評(píng)估vh-vl結(jié)構(gòu)域調(diào)整的影響:變體1:從依照鏈,即分別地在共有vh構(gòu)架上和在共有vl構(gòu)架上比對(duì)的模板結(jié)構(gòu)建立模型,并且在模型加工和能量最低化之前,通過在共有fv結(jié)構(gòu)上的逐鏈比對(duì)來調(diào)整模型的vh-vl取向。這種變體產(chǎn)生多個(gè)模型,其具有與序列無關(guān)的一般的、平均的vh-vl取向。變體2:按照上面描述的那樣,基于序列指紋預(yù)測模型的vh-vl取向,并且根據(jù)它的ab角參數(shù)在數(shù)據(jù)庫中檢索最相似的fv模板。然后通過在所謂的取向模板上逐鏈比對(duì)來調(diào)整模型的vh-vl取向。在變體1和2這兩者中,通過由dunbar等人(7)定義的35個(gè)ab角核心組殘基的cα疊加來實(shí)現(xiàn)在或者共有fv或者取向模板上的逐鏈比對(duì)。變體3:從在常見的共有fv構(gòu)架上而不是依照鏈共有結(jié)構(gòu)比對(duì)的模板結(jié)構(gòu)建立模型并且不調(diào)整vh-vl取向。為了產(chǎn)生代表性的試驗(yàn)組,使用mofvab來從amaii建立11個(gè)抗體fv結(jié)構(gòu)。關(guān)于多種物種(兔、小鼠、人),所述的amaii結(jié)構(gòu)是不同的并且主要由結(jié)合蛋白的抗體組成,抗dnafaba52(pdbid)除外。所有的amaii參比結(jié)構(gòu)是以未結(jié)合的形式被結(jié)晶的。在建模的時(shí)候,通向除原始的amaii“競爭者”以外的更多種模板結(jié)構(gòu)是可能的,包括許多兔抗體結(jié)構(gòu)在內(nèi)。因此,不能把在本文中呈現(xiàn)的根據(jù)rmsd的建模結(jié)果直接地與由原始的盲法建模研究呈現(xiàn)的結(jié)果比較。為了至少模擬盲法建模方案,沒有使用來自每個(gè)鏈具有大于或等于95%的cdr序列同一性的結(jié)構(gòu)的模板片段,其顯而易見地包括amaii的原始晶體結(jié)構(gòu)以及其序列變體在內(nèi)。使用軟件cd-hit(15,16)來進(jìn)行序列相同的模板結(jié)構(gòu)的鑒定以將其排除在建模之外。實(shí)施例4ab角距離計(jì)算為了比較在ab角空間方面的相似度,定義了一組ab角參數(shù)作為元組。于是在兩組ab角參數(shù)之間的歐幾里德距離是一組預(yù)測的ab角參數(shù)始于相關(guān)聯(lián)的標(biāo)準(zhǔn)差組當(dāng)計(jì)算具有標(biāo)準(zhǔn)差的一組預(yù)測的ab角參數(shù)和一組測量的ab角參數(shù)θ之間的距離時(shí),通過使用下列加權(quán)的距離函數(shù),把預(yù)測的不確定性這個(gè)因素包括進(jìn)去:使用加權(quán)的距離函數(shù)用于在數(shù)據(jù)庫中找到與預(yù)測組的ab角參數(shù)最佳匹配的取向模板。當(dāng)distab角和混合角(hl、hc1、lc1、hc2、lc2)與線性(dc)距離度量時(shí),它們不能被解釋成在角空間中的實(shí)際距離,而是僅僅充當(dāng)一種抽象的距離量度。為了計(jì)算ab角取向參數(shù),以在wolfguy編號(hào)的結(jié)構(gòu)上工作的稍微改良版本使用可在http://www.stats,ox.ac.uk/~dunbar/abangle/處得到的由dunbar等人(7)公布的程序代碼。實(shí)施例5相關(guān)性pearson相關(guān)系數(shù)pearson相關(guān)系數(shù)度量兩個(gè)變量x和y之間的線性相關(guān)性。將它計(jì)算成其中cov(x,y)是x和y之間的協(xié)方差以及σ是標(biāo)準(zhǔn)差。使用在r(25)中的標(biāo)準(zhǔn)cor.test方法來計(jì)算相關(guān)系數(shù)和p值,以評(píng)估它是否顯著地不同于零。rv系數(shù)由escoufier引入了rv系數(shù)來度量對(duì)稱方陣(26)之間的相似度??梢匀菀椎匕阉龅亩x延伸到矩形矩陣(27)。對(duì)于兩個(gè)矩陣x和y,可以把rv系數(shù)計(jì)算成其中s=xxt并且t=y(tǒng)yt。為了計(jì)算rv系數(shù)的相關(guān)聯(lián)的p值,即它是否是僅僅偶然那么高,在r中使用來自factominer包的coeffrv-方法,其進(jìn)行置換檢驗(yàn),正如在josse等人(29)中描述的那樣?;谂c參比抗體的角度距離用來舍棄抗體的方法根據(jù)這樣的假定:與參比比較,更大的角度距離暗示更壞的抗體結(jié)合行為,用來舍棄抗體的許多不同的方法是能夠想得到的。i)舍棄最壞的20%在本文中基于它們與參比的角度距離,直接地舍棄某個(gè)百分比的抗體。例如在這里我們選擇舍棄20%。因此在這種算法中的步驟是1.將角度-距離矩陣排序并且記住指標(biāo)2.使用最高的20%的角度-距離指標(biāo)來舍棄最壞的抗體ii)舍棄全部hc/lc在本文中舍棄全部hc或lc并且僅僅產(chǎn)生其它hc/lc組合。為了做到這一點(diǎn),我們提出下列算法1.計(jì)算關(guān)于每一個(gè)hc/lc的平均角度-距離2.顯現(xiàn)這些距離并且選擇想要舍棄的hc/lc亞組iii)舍棄壞的hc/lc組合隨后的方法的一種變型是將要僅僅舍棄具有“壞的”hc/lc組合的抗體。如果對(duì)于個(gè)別抗體,角度-距離與抗體的相關(guān)性不是如此強(qiáng),但是在全部hc和lc上被很好地保留,則這種方法可能表現(xiàn)得很好。所述的算法是:1.計(jì)算每一個(gè)hc/lc的平均角度-距離2.顯現(xiàn)這些距離并且選擇hc/lc亞組,以便僅僅舍棄這些之間的所有可能的組合。實(shí)施例6羰基rmsd為了與amaii一致起見,使用了根據(jù)teplyakov等人(2)的β-片層核心和cdr環(huán)的羰基rmsd和定義。為了確定給定的片段的羰基rmsd,首先利用β-片層核心的cα原子,采用在accelrysdiscoverystudio3.5(20)中提供的重疊法,把模型疊加在晶體結(jié)構(gòu)上。然后把羰基rmsd計(jì)算成給定區(qū)段的主鏈羰基原子相對(duì)于晶體結(jié)構(gòu)的偏差。與通常使用的cα或全部主鏈rmsd比較,所述的羰基rmsd對(duì)于在主鏈構(gòu)象方面的偏差更敏感。同時(shí)基于單獨(dú)的vh或者vl的β-片層核心的疊加,計(jì)算了在amaii中所有的羰基rmsd值,同時(shí)在本文中另外基于vh和vl的β-片層核心的疊加,計(jì)算了羰基rmsd。在全部fv上疊加導(dǎo)致更壞的rmsd值,因?yàn)樗言趘h-vl取向方面的缺陷因素包括進(jìn)去了。當(dāng)重新計(jì)算從http://www.3dabmod.com下載的原始amaii模型的rmsd羰基值時(shí),不是所有的來自原始參比的值都能夠被精確地復(fù)制,這歸因于在疊加算法方面的微小差別或者數(shù)值不準(zhǔn)確。實(shí)施例7采用人源化的抗cd81抗體變體的結(jié)合細(xì)胞elisa對(duì)于結(jié)合細(xì)胞elisa分析,在37℃和5%co2下,在含有10%fcs的f-12dmem培養(yǎng)基中增殖huh7-rluc-h3(表達(dá)cd81的陽性細(xì)胞系)和huh7-rluc-l1(陰性對(duì)照細(xì)胞系)。在第1天,使細(xì)胞以大約90%匯合度受胰蛋白酶作用并且以4x105個(gè)細(xì)胞/ml將其懸浮。在37℃和5%co2下,將2x104個(gè)細(xì)胞/孔的huh7-rluc-h3和huh7-rluc-l1(陰性對(duì)照細(xì)胞系)在50μldmem培養(yǎng)基中鋪板并且允許其附著于96孔聚-d-賴氨酸板(greiner,目錄號(hào)655940)24小時(shí)。在第2天,以兩倍想要的濃度以120μl的最終體積把將要被試驗(yàn)的抗體樣品配制在單獨(dú)的聚丙烯圓底板中。把所有的分析試樣稀釋在細(xì)胞培養(yǎng)基中。把50μl每一種抗體樣品(一式兩份孔)添加到細(xì)胞中,以提供100μl/孔的最終體積并且在4℃下培育持續(xù)2小時(shí)。在初級(jí)培育以后,通過吸出除去樣品并且在室溫下采用0.05%戊二醛在pbs中的溶液(rochediagnosticsgmbh,mannheim,德國,目錄號(hào)1666789)固定細(xì)胞10分鐘。在固定以后,采用200μlpbs/0.05%tween洗滌每一個(gè)孔3次。在室溫下在往復(fù)振蕩器上進(jìn)行次級(jí)培育步驟2h,用于檢測結(jié)合的抗cd81抗體。對(duì)于人源化的cd81k抗體,利用過氧化物酶綴合物綿羊抗人iggγ鏈特異性抗體(thebindingsite,目錄號(hào)ap004)和山羊抗小鼠igg進(jìn)行檢測,對(duì)于js81小鼠陽性對(duì)照抗體(bdbiosciences,目錄號(hào)555675),使用(h+l)-hrp綴合物(biorad,目錄號(hào)170-6516),這兩者都在pbs10%封閉緩沖液中以1∶1000稀釋。采用200μlpbs/0.05%tween洗滌每一個(gè)孔三次以除去未結(jié)合的抗體。使用50μl隨時(shí)可用的tmb溶液(rochediagnosticsgmbh,mannheim,德國,目錄號(hào)1432559)檢測hrp活性并且在大約7-10分鐘以后,采用50μl/孔的1mh2so4停止反應(yīng)。使用酶聯(lián)免疫吸附測定tecan讀數(shù)器在450nm處采用620nm參考波長讀取吸光度。實(shí)施例8動(dòng)力學(xué)篩選根據(jù)schraeml等人(schraeml,m.和m.biehl,methodsmol.biol.901(2012)171-181)在安裝有biacorecm5傳感器的biacore4000儀器上進(jìn)行動(dòng)力學(xué)篩選。biacore4000儀器處于v1.1版軟件的控制之下。把biacorecm5s系列芯片安裝在所述的儀器中并且按照生產(chǎn)商的說明書以水動(dòng)力方式解決問題并且預(yù)先處理。所述儀器的緩沖液是hbs-ep緩沖液(10mmhepes(ph7.4)、150mmnacl、1mmedta、0.05%(w/v)p20)。在所述的傳感器表面上準(zhǔn)備一種抗體捕獲系統(tǒng)。使用nhs/edc化學(xué)以10,000ru,以10mm乙酸鈉緩沖液(ph5)中30μg/ml把具有人igg-fc特異性的多克隆的山羊抗人抗體(jacksonlab.)固定到所述儀器的流動(dòng)池1、2、3和4中的斑點(diǎn)1、2、4和5。在每一個(gè)流動(dòng)池中,把抗體捕獲到斑點(diǎn)1和5上。使用斑點(diǎn)2和斑點(diǎn)4作為參比斑點(diǎn)。采用1m乙醇胺溶液鈍化傳感器。以在補(bǔ)充有1mg/mlcmd(羧甲基葡聚糖)的儀器緩沖液中的44nm和70nm之間的濃度應(yīng)用人源化的抗體衍生物。以30μl/分鐘的流速注射抗體持續(xù)2分鐘。以相對(duì)應(yīng)答單位(ru)測量表面呈現(xiàn)的抗體的捕獲水平(cl)。以30μl/分鐘的流速,以300nm持續(xù)3分鐘注射在溶液中的分析物,磷酸化的人ττ蛋白、非磷酸化的人τ蛋白和磷酸化的人ττ突變體蛋白t422s。監(jiān)測解離持續(xù)5分鐘。通過以30μl/分鐘在所有流動(dòng)池上注射1分鐘的10mm甘氨酸緩沖液ph1.7來再生捕獲系統(tǒng)。使用兩個(gè)報(bào)告點(diǎn):在分析物注射結(jié)束之前不久記錄的信號(hào)(其被表示成結(jié)合晚期(bl))和在解離時(shí)間結(jié)束之前不久記錄的信號(hào)(穩(wěn)定性晚期(sl)),來表征動(dòng)力學(xué)篩選表現(xiàn)。此外,按照朗繆爾模型計(jì)算了離解速率常數(shù)kd(1/s)以及按照公式ln(2)/(60*kd)以分鐘計(jì)算了抗體/抗原復(fù)合物的半衰期。按照公式mr=(結(jié)合晚期(ru))/(捕獲水平(ru))*(mw(抗體)/(mw(抗原))計(jì)算了摩爾比(mr)。在給傳感器配置合適數(shù)量的抗體配體捕獲水平的情況下,每一種抗體應(yīng)該能夠在功能上與在溶液中的至少一種分析物結(jié)合,通過mr=1.0的摩爾比來表示它。于是,摩爾比也是分析物結(jié)合的化合價(jià)方式的指標(biāo)。對(duì)于結(jié)合兩個(gè)分析物的抗體,化合價(jià)最大值可以是mr=2,一個(gè)分析物伴隨每一個(gè)fab化合價(jià)。在另一種實(shí)施方式中,在25℃和37℃下使用相同的實(shí)驗(yàn)設(shè)置,但是使用每一種分析物在溶液中的多個(gè)濃度系列,在0nm(緩沖液)、1.2nm、3.7nm、11.1nm、33.3nm、100nm和300nm下測定了動(dòng)力學(xué)速率。按照生產(chǎn)商的說明書使用biacore評(píng)估軟件和使用rmax全局的朗繆爾1.1模型,從濃度依賴性的結(jié)合行為中計(jì)算了動(dòng)力學(xué)數(shù)據(jù)。參考文獻(xiàn)1.kuroda,d.,etal.,proteineng.des.sel.,25(2012)507-521.2.teplyakov,a.,etal.proteins,2014;doi:10.1002/prot.245543.dunbar,j.,etal.,nuc.acidsres.,42(2014)d1140-d1146.4.abhinandan,k.r.andmartin,a.c.r.,proteineng.des.sel.,23(2010)689-697.5.chailyan,a.,etal.,febsj.,278(2011)2858-28666.narayanan,a.,etal.,j.mol.biol.388(2009)941-953.7.dunbar,j.,etal.,proteineng.des.sel.,26(2013)611-620.8.almagro,j.c.,etal.,proteins79(2011)3050-3066.9.jayaram,n.,etal.,proteineng.des.sel.25(2012)523-529.10.banfield,m.j.,etal.,proteins,29(1997)161-171.11.li,y.,etal.,biochem.,39(2000)6296-6309.12.teplyakov,a.,etal.,actacryst.,f67(2011)1165-1167.13.chothia,c.,etal.,j.mol.biol.,278(1998)457-479.14.chothia,c.andlesk,a.m.,j.mol.biol.196(1987)901-917.15.li,w.andgodzik,a.,bioinformatics,22(2006)1658-1659.16.fu,l.,etal.,bioinformatics,28(2012)3150-3152.17.pan,r.,etal.,j.virol.,87(2013)10221-10231.18.kaas,q.,etal.,brieffunct.genom.prot.,6(2007)253-264.19.accelryssoftwareinc.,pipelinepilot,release8.5.0.200,sandiego:accelryssoftwareinc.,201120.accelryssoftwareinc.,discoverystudiomodelingenvironment,release3.5.0.12158,sandiego:accelryssoftwareinc.,2012.21.niederfellner,g.,etal.,blood,118(2011)358-367.22.kaas,q.,etal.,brieffunct.genom.prot.,6(2007)253-264.23.accelryssoftwareinc.,pipelinepilot,release8.5.0.200,sandiego:accelryssoftwareinc.,2011.24.berman,h.m.,etal.,nucl.acidsres.,28(2000)235-242.25.rcoreteam(2013).r:alanguageandenvironmentforstatisticalcomputing.rfoundationforstatisticalcomputing,vienna,austria.urlhttp://www.r-project.org/.26.robert,p.andescoufier,y.,appl.stat.25(1967)257-26527.abdi,h.,(2007).rvcoefficientandcongruencecoefficient,inn.j.salkind(ed):encyclopediaofmeasurementandstatistics.thousandoaks:sage.28.husson,f.,etal.,(2014).factominer:multivariateexploratorydataanalysisanddataminingwithr.rpackageversion1.26.http://cran.r-project.org/package=factominer29.josse,j.,etal.,comp.stat.dataanal.,53(2008)82-91.當(dāng)前第1頁12