專利名稱::新的hcdr3區(qū)域集合及其應(yīng)用的制作方法新的HCDR3區(qū)域集合及其應(yīng)用本申請要求2005年12月20日提交的序列號為60/751,633的臨時申請的優(yōu)先權(quán),其內(nèi)容在此全部通過引用并入。
背景技術(shù):
:免疫球蛋白重鏈的第三互補(bǔ)決定區(qū)(H-CDR3)構(gòu)成了典型的抗原結(jié)合位點中心,通常在決定抗體的特異性和親和力中起到主要作用。在所有已知的具有適應(yīng)性免疫系統(tǒng)的物種中,H-CDR3比其他五個CDR區(qū)域(H-CDR1、H-CDR2、L-CDR1、L-CDR2或者L-CDR3)中的任意一個都更為多樣化,它們共同構(gòu)成抗原結(jié)合位點的外邊界(7b"egavra,C/w^a爭,7卵9)。已知H-CDR3的平均長度和長度范圍對物種現(xiàn)有的抗原結(jié)合結(jié)構(gòu)的范圍和抗體譜(r印ertoire)的功能具有重要影響(Jo/ms朋&『m,7CWfo爭,從小鼠到人類到牛,H-CDR3的平均長度和長度范圍都是增加的(『m爭,7993)。同一物種中H-CDR3的多樣性也是可以調(diào)節(jié)的。例如,在人類和小鼠中,H-CDR3的長度范圍和多樣性會隨著個體發(fā)育增加(柳2,'Ze函爭,,2)。因其在抗原結(jié)合中的重要作用,H-CDR3區(qū)域可以作為載體引入高多樣性的合成抗體庫,其可用于治療性抗體工程(A:"a/p汝爭,26W)。以簡并引物隨機(jī)化該區(qū)域產(chǎn)生了大量序列多樣性,但是其中至少大部分結(jié)構(gòu)是非正常、沒有功能的(Zem/z"爭,2003)。因此,巨大的合成抗體庫需要具有與已知耙點良好的親和力。Zemlin提到,按照Zemlin對鼠和人類唯一的、功能性的、發(fā)表的H-CDR3區(qū)域的分析,與鼠的H-CDR3區(qū)域相比人類H-CDR3區(qū)域的長度200680053024.7說明書第2/41頁范圍更大。Zemlin還指出,特定氨基酸的頻率隨H-CDR3區(qū)域長度的增加而改變。例如,Zemlin報道隨8-14個氨基酸殘基序列長度的增加,絲氨酸的頻率增加,但是在大于14個氨基酸殘基的序列中,卻表現(xiàn)出混雜的模式。近來,Hoet等在NatureBiotech23:(3)March2005中闡述了包含可變重鏈序列(VH)抗體庫的構(gòu)建,這些序列是部分合成的,而且包含人類供體中得到的HCDR3區(qū)域。特別的是,不包含HCDR3區(qū)域的VH鏈部分(FR1-H-CDR1-FR2-H-CDR2-FR3)是合成的,并且#1并入VH基因中;包含HCDR3區(qū)域的VH鏈部分(H-CDR3-FR4)是從自然發(fā)生的人類自身免疫病人獲得的。Hoet以功能庫多樣性的相似的程度為基礎(chǔ),選擇包括了來自人類供體的HCDR3序列,因此其品質(zhì)不能通過結(jié)合合成的HCDR3區(qū)域入VH鏈而達(dá)到。這點是不足為奇的,^_定其他人釆用了產(chǎn)生所謂的集中HCDR3庫的方法(見示例,公布的美國專利申請US2006/0257937A1),其中通過致力于降低非功能性結(jié)合子(binder)的濃度來控制其多樣性(通過有限的分析已知的V、D和J片段),但是根據(jù)常識教導(dǎo)要在文庫中具有高的濃度才能包含盡量多的多樣性,這就使得文庫的篩選變得異常繁瑣(見專利申請,937A1)。事實上,Hoet提到,在自然產(chǎn)生的人抗體中,HCDR3在4個到大于35個殘基間變化,而且具有非隨機(jī)的序列多樣性;而合成像天然H-CDR3譜一樣,具有的編碼序列和長度都多樣的DNA是不可能的。最后,Hoet介紹了選擇種系基因D片段來幫助HCDR3庫成員正確折疊和結(jié)合,和將D片段納入抗體庫是希望的,由此Hoet描述了專利申請,937Al中指導(dǎo)的HCDR3庫的使用。因為專利申請,937A1中指導(dǎo)的集中庫是由有限的數(shù)據(jù)集構(gòu)建的(即已知的V、D和J片段),所以集中庫的一個實際的結(jié)果是它沒有在每個氨基酸殘基處達(dá)到最適宜的多樣性或變化。相對于Hoet和專利申請'937Al的教導(dǎo),本發(fā)明特別提供了一種合成的人類或者人源化抗體H-CDR3區(qū)域的集合,這些區(qū)域具有本質(zhì)上像天然H-CDR3譜的多樣性,而且通過在編碼H-CDR3的DNA序列中偏倚(biasing)完全隨機(jī)的氨基酸分布,模擬了天然氨基酸的分布。從這個角10度講,本發(fā)明提供了一種抗體庫,它是通過到目前為止纟皮認(rèn)為不可能構(gòu)建的方法構(gòu)建的。
發(fā)明內(nèi)容本發(fā)明提供了一種氨基酸范圍可變的、多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述集合的多樣性由如下產(chǎn)生根據(jù)第一個多樣化因素將長度在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第二個多樣化因素將長度在第二氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,其中所述多樣化因素是不同的。本發(fā)明的目的是提供一種多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述H-CDR3區(qū)域中至少有一部分的長度范圍為約4到約22個氨基酸。本發(fā)明的另一個目的是提供一種多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中第一氨基酸范圍具有約4到約13個氨基酸,第二氨基酸范圍具有約14到約22個氨基酸。一方面,本發(fā)明提供了一種多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述集合的多樣性由如下產(chǎn)生根據(jù)第一個多樣化因素將長度在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第二個多樣化因素將長度在第二氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第三個多樣化因素將長度在第三氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,其中所述多樣化因素是不同的。本發(fā)明的這個集合可以包含多樣化人類或者人源化抗體H-CDR3區(qū)域,其中第一氨基酸范圍具有約4到約9個氨基酸,第二氨基酸范圍具有約10到約16個氨基酸,第三氨基酸范圍具有約17到約22個氨基酸。另一方面,本發(fā)明提供了一種多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述集合的多樣性由如下產(chǎn)生根據(jù)第一個多樣化因素將長度在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第二個多樣化因素將長度在第二氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第三個多樣化因素將長度在第三氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第四個多樣化因素將長度在第四氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第五個多樣化因素將長度在第五氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第六個多樣化因素將長度在第六tt酸范圍內(nèi)的H-CDR3區(qū)域多樣化,其中所述多樣化因素是不同的。本發(fā)明的這個集合可以包含多樣化人類或者人源化抗體H-CDR3區(qū)域,其中第一氨基酸范圍具有約4到約6個氨基酸,第二氨基酸范圍具有約7到約9個氨基酸,第三氨基酸范圍具有約10到約12個氨基酸,第四氨基酸范圍具有約13到約15個氨基酸,第五氨基酸范圍具有約16到約18個氨基酸,第六氨基酸范圍具有約19到約22個氨基酸。再一方面,本發(fā)明提供了一種多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述集合的多樣性由如下產(chǎn)生根據(jù)第一個多樣化因素將長度在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第二個多樣化因素將長度在第二氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第三個多樣化因素將長度在第三氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第四個多樣化因素將長度在第四氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第五個多樣化因素將長度在第五氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第六個多樣化因素將長度在第六氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第七個多樣化因素將長度在第七M(jìn)酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第八個多樣化因素將長度在第八氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,其中所述多樣化因素是不同的。本發(fā)明的這個集合可以包含多樣化人類或者人源化抗體H-CDR3區(qū)域,其中第一氨基酸范圍具有約4到約5個氨基酸,第二氨基酸范圍具有約6到約7個氨基酸,第三氨基酸范圍具有約8到約9個氨基酸,第四氨基酸范圍具有約IO到約1]個氨基酸,第五氨基酸范圍具有約12到約13個氨基酸,第六氨基酸范圍具有約14到約15個氨基酸,第七氛基酸范圍具有約16到約17個氨基酸,第八氨基酸范圍具有約18到約19個氨基酸,第九氨基酸范圍具有約20到約22個氨基酸。本發(fā)明的再一個目的是提供一種多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中第一氨基酸范圍具有約4到約8個氨基酸,且其中第一個多樣化因素要求1位上丙氨酸的頻率為約80%,2位上精氨酸的頻率為約60%,3位上甘氨酸的頻率為約40%,7位上天冬氨酸的頻率為約50%,8位上酪氨酸的頻率為約40%。另一方面,本發(fā)明提供了一種多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中第一氨基酸范圍具有約9到約15個氨基酸,且其中第一個多樣化因素要求1位上丙氨酸的頻率為約90%,2位上精氨酸的頻率為約70%,10位上酪氨酸的頻率為約20%,11位上酪氨酸的頻率為約20%,12位上酪氨酸的頻率為約30%,13位上苯丙氨酸的頻率為約60%,14位上天冬氨酸的頻率為約80%,15位上酪氨酸的頻率為約40%。本發(fā)明提供了一種多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中第一氨基酸范圍具有約16到約22個氨基酸,且其中第一個多樣化因素要求1位上丙氨酸的頻率為約90%,2位上精氨酸的頻率為約60%,3位上天冬氨酸的頻率為約30%,4位上甘氨酸的頻率為約20%,5位上精氨酸的頻率為約10%,6位上精氨酸的頻率為約10%,7位上酪氨酸的頻率為約20%,15位上酪氨酸的頻率為約40%,16位上酪氨酸的頻率為約50%,17位上酪氨酸的頻率為約50%,18位上酪氨酸的頻率為約60%,19位上酪氨酸的頻率為約40%,20位上甲硫氨酸的頻率為約50%,21位上天冬氨酸的頻率為約95%,22位上纈氨酸的頻率為約60%。另一方面,本發(fā)明提供了一種多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中如果抗體H-CDR3區(qū)域的氨基酸長度為約9到約15個氨基酸,那么多樣化由H-CDR3區(qū)域中高含量的甘氨酸和絲氨酸產(chǎn)生。在本發(fā)明的上下文中,與氨基酸或者其基團(tuán)相關(guān)的術(shù)語"高含量"是指該氨基酸或者其基團(tuán)的頻率大于10%。再一方面,本發(fā)明提供了一種多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中如果抗體H-CDR3區(qū)域的氨基酸長度為約16到約22個氨基酸,那么多樣化由H-CDR3區(qū)域中高含量的絲氨酸、H-CDR3區(qū)域末端部分高含量的堿性氨基酸、HCDR3區(qū)域前端部分的天冬氨酸和整個H-CDR3區(qū)域中高含量的芳香氨基酸產(chǎn)生。本發(fā)明的再一個目的是提供一種多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中如果抗體H-CDR3區(qū)域的氨基酸長度是5個氨基酸,那么氨基酸組成為1位上60%的丙氨酸,20%的蘇氨酸和0.58%的除半胱氨酸外所有天然存在氨基酸的混合物,2位上30%的精氨酸,30%的賴氨酸,30%的蘇氨酸和0.55%的除半胱氨酸外所有天然存在氨基酸的混合物,3位上40%的天冬氨酸,40%的苯丙氨酸和0.58%的除半胱氨酸外所有天然存在氨基酸的混合物,4位上30%的天冬氨酸,30%的甘氨酸,30%的甲硫氨酸和0.63%的除半胱氨酸外所有天然存在氨基酸的混合物以及5位上30%的酪氨酸,30%的天冬氨酸和0.58%的除半胱氨酸外所有天然存在氨基酸的混合物。本發(fā)明的另一個目的是提供一種多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中如果抗體H-CDR3區(qū)域的氨基酸長度是12個氨基酸,那么氨基酸組成為1位上85%的丙氨酸和15%的蘇氨酸和纈氨酸的混合物,2位上70%的精氨酸和30%絲氨酸、蘇氨酸、甘氨酸和丙氨酸的混合物,9位上20%的丙氨酸、絲氨酸和酪氨酸的混合物以及0.63%的除半胱氨酸外所有天然存在的氨基酸,10位上60%的苯丙氨酸,10%的曱硫氨酸和0.58%的除半胱氨酸外所有天然存在的氨基酸,11位上80%的天冬氨酸,5%的甘氨酸和0.58%的除半胱氨酸外所有天然存在的氨基酸,以及12位上50%的酪氨酸,10%的纈氨酸和異亮氨酸的混合物和0.63%的除半胱氨酸外所有天然存在的氨基酸。本發(fā)明的另一個目的是提供一種多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中如果抗體H-CDR3區(qū)域的氨基酸長度是20個氨基酸,那么氨基酸組成為1位上100%的丙氨酸,2位上50%的精氨酸和50%的賴氨酸,3位上30%的甘氨酸和0.55%的除半胱氨酸外所有天然存在的氨基酸,4位上20%的精氨酸,20%的甘氨酸,20%的亮氨酸和0.63%的除半胱氨酸外所有天然存在的氨基酸,14位上20%的絲氨酸,20%的蘇氨酸,20%的半胱氨酸和0.63%的除半胱氨酸外所有天然存在的氨基酸,21位上95%的天冬氨酸以及22位上50%的纈氨酸和0.55%的除半胱氨酸外所有天然存在的氨基酸。本發(fā)明還涉及一種多樣化人類或者人源化抗體可變重鏈的集合,其包含具有不同氨基酸范圍的、多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述集合的多樣性由如下產(chǎn)生根據(jù)第一個多樣化因素將長度在第一^^基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第二個多樣化因素將長度在第二氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化。另一方面,本發(fā)明還提供了一種多樣化人類或者人源化抗體或者其功能性片段的集合,該片段的集合包含人類或者人源化抗體可變重鏈的集合,根據(jù)本發(fā)明,該重鏈的集合包含不同氨基酸范圍的、多樣化人類或者人源化抗體H-CDR3區(qū)域的集合。再一方面,本發(fā)明還提供了一種合成的人類或者人源化抗體庫,其包含多樣化人類或者人源化抗體或者其功能性片段的集合,根據(jù)本發(fā)明,該抗體或其功能性片段的集合包含人類或者人源化抗體可變重鏈的集合。在另一個實施方案中,本發(fā)明涉及一種編碼多樣化人類或者人源化H-CDR3區(qū)域的核酸分子集合的制備方法,其包含合成多個DNA分子,其中每個DNA分子編碼一個H-CDR3區(qū)域,其中所述H-CDR3區(qū)域具有不同的范圍,其中根據(jù)第一個多樣化因素,合成編碼第一氨基酸范圍內(nèi)H-CDR3區(qū)域的DNA分子;并且其中根據(jù)第二個多樣化因素,合成編碼第二M酸范圍內(nèi)H-CDR3區(qū)域的DNA分子,其中所述多樣化因素是不同的。本發(fā)明還涉及一種編碼根據(jù)本發(fā)明的多樣化人類或者人源化抗體H-CDR3區(qū)域集合的核酸集合。本發(fā)明還涉及一種編碼氨基酸范圍可變的、多樣化人類或者人源化抗體H-CDR3區(qū)域集合的核酸集合,其中所述集合的多樣性由如下產(chǎn)生根據(jù)第一個多樣化因素將長度在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第二個多樣化因素將長度在第二氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,其中所述多樣化因素是不同的。本發(fā)明的又一個目的是提供一種得到不同長度的、多樣化人類或者人源化抗體H-CDR3區(qū)域的集合的方法,其包括表達(dá)核酸集合。應(yīng)理解的是,本發(fā)明的上下文中,在其他多樣化H-CDR3區(qū)域中一個或者多個氨基酸位置是保持恒定的。本領(lǐng)域技術(shù)人員應(yīng)理解為了在H-CDR3區(qū)域中引入多樣性的三核苷酸混合物的合成效率,以及克隆多種多樣化H-CDR3區(qū)域的效率,在H-CDR3區(qū)域中插入一個或多個恒定位點是希望的。這樣,本發(fā)明的另一個目的是提供一種多樣化人類或者人源化H-CDR3區(qū)域的集合,其中如果所述集合中成員的長度是4到8個氨基酸,那么應(yīng)用于所述長度是4-8個氨基酸的所述成員的多樣化因素在具有所述長度的所述成員的H-CDR3區(qū)域中定義了0,1,2或3個恒定的氨基酸位點。本發(fā)明還涉及一種多樣化人類或者人源化H-CDR3區(qū)域的集合,其中如果所述集合中成員的長度是9到IO個氨基酸,那么應(yīng)用于所述長度是9到10個氨基酸的所述成員的多樣化因素在具有所述長度的所述成員的H-CDR3區(qū)域中定義了0,1,2或3個恒定的氨基酸位點。本發(fā)明還涉及一種多樣化人類或者人源化H-CDR3區(qū)域的集合,其中如果所述集合中成員的長度是ll到13個氨基酸,那么應(yīng)用于所述長度是11到13個氨基酸的所述成員的多樣化因素在具有所述長度的所述成員的H-CDR3區(qū)域中定義了0,1,2或3個恒定的氨基酸位點。本發(fā)明的另一個目的是提供一種多樣化人類或者人源化H-CDR3區(qū)域的集合,其中如果所迷集合中成員的長度是14個氨基酸,那么應(yīng)用于所述長度是14個氨基定義了0,1,2,3,4或5個恒定的氨基酸位點。本發(fā)明還涉及一種多樣化人類或者人源化H-CDR3區(qū)域的集合,其中如果所述集合中成員的長度是15-16個氨基酸,那么應(yīng)用于所述長度是15-16個氨基酸的所述成員的多樣化因素在具有所述長度的所述成員的H-CDR3區(qū)域中定義了0,1,2,3,4,5,6,7或8個恒定的氨基酸位點。本發(fā)明的另一個目的是提供一種多樣化人類或者人源化H-CDR3區(qū)域的集合,其中如果所述集合中成員的長度是16-17個氨基酸,那么應(yīng)用于所述長度是16-17個氨基酸的所述成員的多樣化因素在具有所述長度的所述成員的H-CDR3區(qū)域中定義了0,1,2,3,4,5,6,7或8個恒定的氨基酸位點。本發(fā)明還涉及一種多樣化人類或者人源化H-CDR3區(qū)域的集合,其中如果所述集合中成員的長度是18個氨基酸,那么應(yīng)用于所述長度是18個氨基酸的所述成員的多樣化因素在具有所述長度的所述成員的H-CDR3區(qū)域中定義了0,1,2,3,4,5,6,7或8個恒定的氨基酸位點。本發(fā)明還涉及一種多樣化人類或者人源化H-CDR3區(qū)域的集合,其中如果所述集合中成員的長度是19個或更多氨基酸,那么應(yīng)用于所述長度是19個或更多氨基酸的所述成員的多樣化因素在具有所述長度的所述成員的H-CDR3區(qū)域中定義了0,1,2,3,4,5,6或7個恒定的氨基酸位點。圖1:左側(cè)對齊;圖lb所描繪"樓梯,,中的每一個臺階代表帶有一個定義HCDR3長度的平均380個序列的共有序列。在左側(cè)的對齊中,不同長度通過沿對角線加入另外的氨基酸殘基對齊,從左到右長度依次增加。圖2:右側(cè)對齊;圖2b所描繪"樓梯"中的每一個臺階代表帶有一個定義HCDR3長度的平均380個序列的共有序列。在右側(cè)的對齊中,不同長度通過沿對角線加入另外的氨基酸殘基對齊,從右到左長度依次增加。圖3a+3b+3c:中間對齊(側(cè)面區(qū)域,環(huán)區(qū),混合-中心);右圖所描繪的圖中每一層代表帶有一個定義HCDR3長度的平均380個序列的共有序列。在側(cè)面區(qū)域?qū)R中,不同長度通過交替地沿對角線加入另外的氨基酸殘基對齊,從外面中點到里面(從側(cè)面區(qū)域到環(huán)區(qū))長度依次增加。黑灰色的方塊示例新加入的殘基。圖4:抗體可變區(qū)的編號圖例。具體實施例方式一方面,本發(fā)明特別提供了一種合成的人類或者人源化抗體H-CDR3區(qū)域的集合,這些區(qū)域具有本質(zhì)像天然H-CDR3語中的多樣性,模擬了天然氨基酸的分布,這是通過根據(jù)特定的H-CDR區(qū)域長度,偏倚在編碼H-CDR3的DNA序列中隨機(jī)的氨基酸分布而實現(xiàn)的。對常規(guī)的數(shù)據(jù)庫(例如Ig-BLAST)得到的人類抗體序列進(jìn)行分析并用作決定H-CDR3區(qū)域氨基酸分布的基礎(chǔ),而不是僅使用有限的數(shù)據(jù)集,即已知的V、D和J片段。從這個角度講,本發(fā)明提供了一種抗體庫,它是通過到目前為止被認(rèn)為不可能構(gòu)建的方法構(gòu)建的。本發(fā)明還提供了一種氨基酸長度不同的、多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述集合的多樣性由如下產(chǎn)生根據(jù)第一個多樣化因素將長度在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,以及4艮據(jù)第二個多樣化因素將長度在第二M酸范圍內(nèi)的H-CDR3區(qū)域多樣化。本發(fā)明的上下文中,術(shù)語"多樣化因素"是指對于每一個H-CDR3區(qū)域中任何給定范圍的氨基酸殘基,某個氨基酸在所述H-CDR3區(qū)域中一個或多個給定位置出現(xiàn)的頻率。本發(fā)明的上下文中,一個氨基酸在給定位置的"頻率"是指該氨基酸在該位置出現(xiàn)的可能性,根據(jù)此處闡明的教導(dǎo),這個頻率是0%-100%。在自然產(chǎn)生的人類抗體中,H-CDR3區(qū)域的長度在約4到35個氨基酸范圍內(nèi)變動。因而本發(fā)明預(yù)期每一個H-CDR3區(qū)域中氨基酸殘基的長度可能為4到35個氨基酸,優(yōu)選的是4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21或者22個氨基酸殘基長度,正如這里更為詳細(xì)的描述,應(yīng)用特定的多樣化因素的氨基酸的范圍會變化。本發(fā)明中人類或人源化的抗體和/或抗體H-CDR3區(qū)域能被應(yīng)用到很多環(huán)境下,這里將作更為全面的描述。一方面,本發(fā)明提供了根據(jù)二到四個多樣化因素將具有不同氨基酸長度的H-CDR3區(qū)域多樣化。因此,多樣化人類或者人源化抗體H-CDR3區(qū)域的集合由如下產(chǎn)生根據(jù)第一個多樣化因素將長度在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第二個多樣化因素將長度在第二氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化。本發(fā)明的上下文中,第一個和第二個多樣化因素是不同的。第一氨基酸范圍具有約4到約13個氣基酸,第二氨基酸范圍具有約14到約22個氨基酸。多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生可能應(yīng)用如下規(guī)律第一個多樣化因素適用于約4到約9個氨基酸長度的H-CDR3區(qū)域成員,第二個多樣化因素適用于約10到約16個氨基酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約17到約22個氨基酸長度的H-CDR3區(qū)域成員??蛇x擇的,多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生,舉例說明,應(yīng)用如下規(guī)律第一個多樣化因素適用于約4到約8個氨基酸長度的H-CDR3區(qū)域成員,笫二個多樣化因素適用于約9到約13個氨基酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約14到約18個氨基酸長度的H-CDR3區(qū)域成員,第四個多樣化因素適用于約19到約22個tt酸長度的H-CDR3區(qū)J或成員。另一方面,本發(fā)明提供了根據(jù)五到七個多樣化因素將具有不同氨基酸長度的H-CDR3區(qū)域多樣化。多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生可能應(yīng)用如下規(guī)律第一個多樣化因素適用于約4到約7個氨基酸長度的H-CDR3區(qū)域成員,第二個多樣化因素適用于約8到約11個氨基酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約12到約15個氨基酸長度的H-CDR3區(qū)域成員,第四個多樣化因素適用于約16到約19個氨基酸長度的H-CDR3區(qū)域成員,第五個多樣化因素適用于約20到約22個氨基酸長度的H-CDR3區(qū)域成員。多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生也可能應(yīng)用如下規(guī)律第一個多樣化因素適用于約4到約6個氨基酸長度的H-CDR3區(qū)域成員,第二個多樣化因素適用于約7到約9個氨基酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約10到約12個氨基酸長度的H-CDR3區(qū)域成員,第四個多樣化因素適用于約13到約15個氨基酸長度的H-CDR3區(qū)域成員,第五個多樣化因素適用于約16到約]8個氨基酸長度的H-CDR3區(qū)域成員,第六個多樣化因素適用于約19到約22個氨基酸長度的H-CDR3區(qū)域成員。多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生也可能應(yīng)用如下規(guī)律第一個多樣化因素適用于約4到約6個氨基酸長度的H-CDR3區(qū)域成員,第二個多樣化因素適用于約7到約9個氨基酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約10到約12個M酸長度的H-CDR3區(qū)域成員,第四個多樣化因素適用于約13到約15個氨基酸長度的H-CDR3區(qū)域成員,第五個多樣化因素適用于約16到約18個tt酸長度的H-CDR3區(qū)域成員,第六個多樣化因素適用于約19到約20個氨基酸長度的H-CDR3區(qū)域成員,第七個多樣化因素適用于約21到約22個氨基酸長度的H-CDR3區(qū)i或成員。另一方面,本發(fā)明提供了根據(jù)八到十個多樣化因素將具有不同氨基酸長度的H-CDR3區(qū)域多樣化。多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生可能應(yīng)用如下規(guī)律第一個多樣化因素適用于約4到約6個氨基酸長度的H-CDR3區(qū)域成員,第二個多樣化因素適用于約7到約8個氨基酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約9到約11個氨基酸長度的H-CDR3區(qū)域成員,第四個多樣化因素適用于約12到約14個氨基酸長度的H-CDR3區(qū)域成員,第五個多樣化因素適用于約15到約16個氨基酸長度的H-CDR3區(qū)域成員,第六個多樣化因素適用于約17到約18個氨基酸長度的H-CDR3區(qū)域成員,第七個多樣化因素適用于約19到約20個氨基酸長度的H-CDR3區(qū)域成員,第八個多樣化因素適用于約21到約22個氨基酸長度的H-CDR3區(qū)域成員??蛇x擇的,多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生可能應(yīng)用如下規(guī)律第一個多樣化因素適用于約4到約5個氨基酸長度的H-CDR3區(qū)域成員,第二個多樣化因素適用于約6到約7個tt酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約8到約9個氨基酸長度的H-CDR3區(qū)域成員,第四個多樣化因素適用于約10到約11個氨基酸長度的H-CDR3區(qū)域成員,第五個多樣化因素適用于約12到約13個氨基酸長度的H-CDR3區(qū)域成員,第六個多樣化因素適用于約14到約15個tt酸長度的H-CDR3區(qū)域成員,第七個多樣化因素適用于約16到約17個氨基酸長度的H-CDR3區(qū)域成員,第八個多樣化因素適用于約18到約19個tt酸長度的H-CDR3區(qū)域成員,第九個多樣化因素適用于約20到約22個氨基酸長度的H-CDR3區(qū)域成員。多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生也可能應(yīng)用如下規(guī)律第一個多樣化因素適用于約4到約5個氨基酸長度的H-CDR3區(qū)域成員,第二個多樣化因素適用于約6到約7個氨基酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約8到約9個氨基酸長度的H-CDR3區(qū)域成員,第四個多樣化因素適用于約10到約11個氨基酸長度的H-CDR3區(qū)域成員,第五個多樣化因素適用于約12到約13個tt酸長度的H-CDR3區(qū)域成員,第六個多樣化因素適用于約14到約15個氨基酸長度的H-CDR3區(qū)域成員,第七個多樣化因素適用于約16到約17個氨基酸長度的H-CDR3區(qū)域成員,第八個多樣化因素適用于約18到約19個氨基酸長度的H-CDR3區(qū)域成員,第九個多樣化因素適用于約20到約21個氨基酸長度的H-CDR3區(qū)域成員,第十個多樣化因素適用于約22個氨基酸長度的H-CDR3區(qū)域成員。另一方面,本發(fā)明提供了根據(jù)十一到十四個多樣化因素將具有不同氨基酸長度的H-CDR3區(qū)域多樣化。多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生可能應(yīng)用如下規(guī)律第一個多樣化因素適用于約4到約5個氨基酸長度的H-CDR3區(qū)域成員,第二個多樣化因素適用于約6到約7個氨基酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約8個氨基酸長度的H-CDR3區(qū)域成員,第四個多樣化因素適用于約9到約10個氨基酸長度的H-CDR3區(qū)域成員,第五個多樣化因素適用于約11個氨基酸長度的H-CDR3區(qū)域成員,第六個多樣化因素適用于約12到約13個氨基酸長度的H-CDR3區(qū)域成員,第七個多樣化因素適用于約14到約15個M酸長度的H-CDR3區(qū)域成員,第八個多樣化因素適用于約16到約17個氨基酸長度的H-CDR3區(qū)域成員,第九個多樣化因素適用于約18到約19個氨基酸長度的H-CDR3區(qū)域成員,第十個多樣化因素適用于約20個氨基酸長度的H-CDR3區(qū)域成員,第十一個多樣化因素適用于約2]到約22個氨基酸長度的H-CDR3區(qū)域成員。多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生也可能應(yīng)用如下規(guī)律第一個多樣化因素適用于約4到約5個氨基酸長度的H-CDR3區(qū)域成員,第二個多樣化因素適用于約6個tt酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約7個氨基酸長度的H-CDR3區(qū)域成員,第四個多樣化因素適用于約8到約9個氨基酸長度的H-CDR3區(qū)域成員,第五個多樣化因素適用于約10個氨基酸長度的H-CDR3區(qū)域成員,第六個多樣化因素適用于約11到約12個氨基酸長度的H-CDR3區(qū)域成員,第七個多樣化因素適用于約13個M酸長度的H-CDR3區(qū)域成員,第八個多樣化因素適用于約14到約15個氨基酸長度的H-CDR3區(qū)域成員,第九個多樣化因素適用于約16到約17個氨基酸長度的H-CDR3區(qū)域成員,第十個多樣化因素適用于約18個tt酸長度的H-CDR3區(qū)域成員,第十一個多樣化因素適用于約19到約20個tt酸長度的H-CDR3區(qū)域成員,第十二個多樣化因素適用于約21到約22個氨基酸長度的H-CDR3區(qū)域成員。多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生可能應(yīng)用如下規(guī)律第一個多樣化因素適用于約4到約5個氨基酸長度的H-CDR3區(qū)域成員,第二個多樣化因素適用于約6個氨基酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約7個氨基酸長度的H-CDR3區(qū)域成員,第四個多樣化因素適用于約8到約9個氨基酸長度的H-CDR3區(qū)域成員,第五個多樣化因素適用于約10個氨基酸長度的H-CDR3區(qū)域成員,第六個多樣化因素適用于約11到約12個氨基酸長度的H-CDR3區(qū)域成員,第七個多樣化因素適用于約13個氨基酸長度的H-CDR3區(qū)域成員,第八個多樣化因素適用于約14到約15個氨基酸長度的H-CDR3區(qū)域成員,第九個多樣化因素適用于約16到約17個氨基酸長度的H-CDR3區(qū)域成員,第十個多樣化因素適用于約18個氨基酸長度的H-CDR3區(qū)域成員,第十一個多樣化因素適用于約19到約20個酸長度的H-CDR3區(qū)域成員,第十二個多樣化因素適用于約21個氨基酸長度的H-CDR3區(qū)域成員,第十三個多樣化因素適用于約22個氨基酸長度的H-CDR3區(qū)域成員。可選的,多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生可能應(yīng)用如下規(guī)律第一個多樣化因素適用于約4到約5個氨基酸長度的H-CDR3區(qū)域成員,第二個多樣化因素適用于6個氨基酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約7個氨基酸長度的H-CDR3區(qū)域成員,第四個多樣化因素適用于約8個氨基酸長度的H-CDR3區(qū)域成員,第五個多樣化因素適用于約9個氨基酸長度的H-CDR3區(qū)域成員,第六個多樣化因素適用于約10到約11個氨基酸長度的H-CDR3區(qū)域成員,第七個多樣化因素適用于約12個氨基酸長度的H-CDR3區(qū)域成員,第八個多樣化因素適用于約13到約14個氨基酸長度的H-CDR3區(qū)域成員,第九個多樣化因素適用于約15到約16個氨基酸長度的H-CDR3區(qū)域成員,第十個多樣化因素適用于約17個氨基酸長度的H-CDR3區(qū)域成員,第十一個多樣化因素適用于約18到約19個氨基酸長度的H-CDR3區(qū)域成員,第十二個多樣化因素適用于約20個tt酸長度的H-CDR3區(qū)域成員,第十三個多樣化因素適用于約21個氨基酸長度的H-CDR3區(qū)域成員,第十四個多樣化因素適用于約22個氨基酸長度的H-CDR3區(qū)域成員。另一方面,本發(fā)明提供了根據(jù)十五到十七個多樣化因素將具有不同氨基酸長度的H-CDR3區(qū)域多樣化。多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生可能應(yīng)用如下規(guī)律第一個多樣化因素適用于約4到約5個氨基酸長度的H-CDR3區(qū)域成員,第二個多樣化因素適用于約6個氨基酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約7個氨基酸長度的H-CDR3區(qū)域成員,第四個多樣化因素適用于約8個氨基酸長度的H-CDR3區(qū)域成員,第五個多樣化因素適用于約9個氨基酸長度的H-CDR3區(qū)域成員,第六個多樣化因素適用于約10到約11個氨基酸長度的H-CDR3區(qū)域成員,第七個多樣化因素適用于約12個氨基酸長度的H-CDR3區(qū)域成員,第八個多樣化因素適用于約13個氨基酸長度的H-CDR3區(qū)域成員,第九個多樣化因素適用于約14到約15個氨基酸長度的H-CDR3區(qū)域成員,第十個多樣化因素適用于約16個氨基酸長度的H-CDR3區(qū)域成員,第十一個多樣化因素適用于約17到約18個氨基酸長度的H-CDR3區(qū)域成員,第十二個多樣化因素適用于約19個氨基酸長度的H-CDR3區(qū)域成員,第十三個多樣化因素適用于約20個氨基酸長度的H-CDR3區(qū)域成員,第十四個多樣化因素適用于約21個氨基酸長度的H-CDR3區(qū)域成員,第十五個多樣化因素適用于約22個氨基酸長度的H-CDR3區(qū)域成員。多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生可能應(yīng)用如下少見律第一個多樣化因素適用于約4到約5個氨基酸長度的H-CDR3區(qū)域成員,第二個多樣化因素適用于約6個氨基酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約7個氨基酸長度的H-CDR3區(qū)域成員,第四個多樣化因素適用于約8個氨基酸長度的H-CDR3區(qū)域成員,第五個多樣化因素適用于約9個氨基酸長度的H-CDR3區(qū)域成員,第六個多樣化因素適用于約10到約11個氨基酸長度的H-CDR3區(qū)域成員,第七個多樣化因素適用于約12個氨基酸長度的H-CDR3區(qū)域成員,第八個多樣化因素適用于約13個氨基酸長度的H-CDR3區(qū)域成員,第九個多樣化因素適用于約14個氨基酸長度的H-CDR3區(qū)域成員,第十個多樣化因素適用于約15個M酸長度的H-CDR3區(qū)域成員,第十一個多樣化因素適用于約16個氨基酸長度的H-CDR3區(qū)域成員,第十二個多樣化因素適用于約17個氨基酸長度的H-CDR3區(qū)域成員,第十三個多樣化因素適用于約18到約19個氨基酸長度的H-CDR3區(qū)域成員,第十四個多樣化因素適用于約20個氨基酸長度的H-CDR3區(qū)域成員,第十五個多樣化因素適用于約21個氨基酸長度的H-CDR3區(qū)域成員,第十六個多樣化因素適用于約22個氨基酸長度的H-CDR3區(qū)域成員。多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生可能應(yīng)用如下規(guī)律第一個多樣化因素適用于約4個氨基酸長度的H-CDR3區(qū)域成員,第二個多樣化因素適用于約5個氨基酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約6到約7個氨基酸長度的H-CDR3區(qū)域成員,第四個多樣化因素適用于約8個氨基酸長度的H-CDR3區(qū)域成員,第五個多樣化因素適用于約9個tt酸長度的H-CDR3區(qū)域成員,第六個多樣化因素適用于約10個氨基酸長度的H-CDR3區(qū)域成員,第七個多樣化因素適用于約11個氨基酸長度的H-CDR3區(qū)域成員,第八個多樣化因素適用于約12個氨基酸長度的H-CDR3區(qū)域成員,第九個多樣化因素適用于約13個氨基酸長度的H-CDR3區(qū)域成員,第十個多樣化因素適用于約14個氨基酸長度的H-CDR3區(qū)域成員,第十一個多樣化因素適用于約15個氨基酸長度的H-CDR3區(qū)域成員,第十二個多樣化因素適用于約16個氨基酸長度的H-CDR3區(qū)域成員,第十三個多樣化因素適用于約17到約18個氨基酸長度的H-CDR3區(qū)域成員,第十四個多樣化因素適用于約19個氨基酸長度的H-CDR3區(qū)域成員,第十五個多樣化因素適用于約20個氨基酸長度的H-CDR3區(qū)域成員,第十六個多樣化因素適用于約21個氨基酸長度的H-CDR3區(qū)域成員,第十七個多樣化因素適用于約22個氨基酸長度的H-CDR3區(qū)域成員。另一方面,本發(fā)明提供了根據(jù)十八到十九個多樣化因素將具有不同氨基酸長度的H-CDR3區(qū)域多樣化。多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生可能應(yīng)用如下規(guī)律第一個多樣化因素適用于約4個tt酸長度的H-CDR3區(qū)域成員,第二個多樣化因素適用于約5個氨基酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約6個氨基酸長度的H-CDR3區(qū)域成員,第四個多樣化因素適用于約7個氨基酸長度的H-CDR3區(qū)域成員,第五個多樣化因素適用于約8個氨基酸長度的H-CDR3區(qū)域成員,第六個多樣化因素適用于約9個氨基酸長度的H-CDR3區(qū)域成員,第七個多樣化因素適用于約10個氨基酸長度的H-CDR3區(qū)域成員,第八個多樣化因素適用于約11個氨基酸長度的H-CDR3區(qū)域成員,第九個多樣化因素適用于約12個氨基酸長度的H-CDR3區(qū)域成員,第十個多樣化因素適用于約13個氨基酸長度的H-CDR3區(qū)域成員,第十一個多樣化因素適用于約14個氨基酸長度的H-CDR3區(qū)域成員,第十二個多樣化因素適用于約15個氨基酸長度的H-CDR3區(qū)域成員,第十三個多樣化因素適用于約16到約17個氨基酸長度的H-CDR3區(qū)域成員,第十四個多樣化因素適用于約18個氨基酸長度的H-CDR3區(qū)域成員,第十五個多樣化因素適用于約19個氨基酸長度的H-CDR3區(qū)域成員,第十六個多樣化因素適用于約20個M酸長度的H-CDR3區(qū)域成員,第十七個多樣化因素適用于約21個氨基酸長度的H-CDR3區(qū)域成員,第十八個多樣化因素適用于約22個氨基酸長度的H到CDR3區(qū)域成員。多樣化人類或者人源化抗體H-CDR3區(qū)域集合的多樣性的產(chǎn)生也可能應(yīng)用如下規(guī)律第一個多樣化因素適用于約4個氨基酸長度的H-CDR3區(qū)域成員,第二個多樣化因素適用于約5個氨基酸長度的H-CDR3區(qū)域成員,第三個多樣化因素適用于約6個氨基酸長度的H-CDR3區(qū)域成員,第四個多樣化因素適用于約7個氨基酸長度的H-CDR3區(qū)域成員,第五個多樣化因素適用于約8個氨基酸長度的H-CDR3區(qū)域成員,第六個多樣化因素適用于約9個氨基酸長度的H-CDR3區(qū)域成員,第七個多樣化因素適用于約10個氨基酸長度的H-CDR3區(qū)域成員,第八個多樣化因素適用于約11個氨基酸長度的H-CDR3區(qū)域成員,第九個多樣化因素適用于約12個氨基酸長度的H-CDR3區(qū)域成員,第十個多樣化因素適用于約13個氨基酸長度的H-CDR3區(qū)域成員,第十一個多樣化因素適用于約14個氨基酸長度的H-CDR3區(qū)域成員,第十二個多樣化因素適用于約15個氨基酸長度的H-CDR3區(qū)域成員,第十三個多樣化因素適用于約16個氨基酸長度的H-CDR3區(qū)域成員,第十四個多樣化因素適用于約17個氨基酸長度的H-CDR3區(qū)域成員,第十五個多樣化因素適用于約18個氨基酸長度的H-CDR3區(qū)域成員,第十六個多樣化因素適用于約19個氨基酸長度的H-CDR3區(qū)域成員,第十七個多樣化因素適用于約20個氨基酸長度的H-CDR3區(qū)域成員,第十八個多樣化因素適用于約21個氨基酸長度的H-CDR3區(qū)域成員,第十九個多樣化因素適用于約22個氨基酸長度的H-CDR3區(qū)i或成員。本領(lǐng)域技術(shù)人員會理解,多樣化因素的數(shù)目總計可達(dá)到具有定義長度的H-CDR3區(qū)域成員中氨基S吏位置的數(shù)目。優(yōu)選的是,應(yīng)用多達(dá)19個的多樣化因素,而且本發(fā)明中多樣化H-CDR3區(qū)域的集合可以聯(lián)合形成多種多樣化H-CDR3區(qū)域的集合,其形式是以單獨的H-CDR3區(qū)域形式或者作為可變重鏈區(qū)的一部分或者免疫球蛋白鏈的全長或?qū)嵸|(zhì)上的全長的形式。實施例下面非限制的例子通過指定某一多樣化因素的參數(shù),更為特定地說明了本發(fā)明的多種實施方案,所述多樣化因素應(yīng)用于氨基酸(aa)長度在特定范圍內(nèi)的H-CDR3區(qū)域。本領(lǐng)域技術(shù)人員會理解,根據(jù)下面提到的理論設(shè)計方案,只要沒有偏離本發(fā)明的范圍,某些多樣性(氨基酸頻率)偏離是允許的,因此,舉例而言,可能有希望基于或者至少部分基于這樣的理論設(shè)計,實施某種克隆效率來構(gòu)建一個庫。為了準(zhǔn)備H-CDR3設(shè)計,修改和編輯序列供分析的數(shù)據(jù)集來自NCBI服務(wù)器上的Ig-BLAST。下載包括Ig-BLAST數(shù)據(jù)記錄的以下文件ftp:〃ftp.ncbi.nih.gov/blast/db/FASTA/igSeqProt.gz??偣蚕螺d了40,808條數(shù)據(jù)記錄,分別是FASTA格式的人類、小鼠或者數(shù)據(jù)條目的名稱標(biāo)簽上沒有歸屬的記錄。在名稱標(biāo)簽中用MS-Word格式的關(guān)鍵字"人類"過濾數(shù)據(jù),關(guān)于人類抗體的22,500個條目被提取出來。在關(guān)于人類抗體的22,500個條目中,有13,235個歸屬于重鏈,5,490個歸屬于輕鏈。剩余的抗體進(jìn)一步歸屬于hc,1c-k和1c-X,因為它們的名稱標(biāo)簽中沒有關(guān)鍵字被發(fā)現(xiàn)。對于重鏈,在MS-Excel不同工作表中匯編了不同長度的長度依賴的H-CDR3集合。對于H-CDR3的分析,13,235個序列中有8,886個重鏈的序列可以用于分析。長度依賴的H-CDR3設(shè)計作為一個實例,根據(jù)三個多樣化因素,得到了下面三個單獨的設(shè)計4aa-7aa8aa-14aa15aa-23aaKabat中102位上,在8-23個氨基酸的長度中Y含量從50%降到5%,這個位點的V含量從12。/。升高到65。/。。另外,101位的D含量從75。/。升高到100%。為了實施長度范圍中的不同氨基酸的發(fā)現(xiàn),但不限制本發(fā)明的范圍,在基于環(huán)區(qū)的設(shè)計中,決定用2個不同的多樣化因素會更好一個來自8-14個氨基酸,另一個來自15-23個氨基酸,而應(yīng)用于4-7個氨基酸長度的H-CDR3區(qū)域的多樣化因素可依照左邊的設(shè)計。對齊類型為了總結(jié)多個氨基酸長度的一種設(shè)計,下面對齊類型可作為包含8-14和15-23個氨基酸的庫成員設(shè)計的典型選擇(表l):左側(cè)對齊,右側(cè)對齊和對稱對齊。<image>imageseeoriginaldocumentpage27</image>表l:對齊類型;前三個和最后一個位點是H-CDR3區(qū)域側(cè)翼的框架區(qū)的恒定氨基酸位點。"樓梯"中的每一個臺階代表某一長度的共有序列。前三個位點代表臨近框架區(qū)的部分Kabat中92,93和94位的CAR區(qū)及位于Kabat中103位的FW4(WGQG)開端的W。左側(cè)對齊(表1+圖1):對齊前三個位點(Kabat96、97和98位)為方塊形。這些位點位于V和D片段的邊界上,可能是V編碼的(即種系基因)。因此這些位點在組成上可能與HCDR3剩余的位點不同,而且保持分離。96位和97位與H-CDR3其他的位點不同,因為它們的Y含量降低,但是96位的D含量是升高的。最后五個位點(Kabat1、m、n、101和102位)包括主要的FDY序列,其也對齊為方塊形。101和102位通常是J片段編碼的,且由此表現(xiàn)出相似的氨基酸分布。首先,用aa填充前三個和后五個位置后,左側(cè)對齊乂人Kabat99位開始,接連填滿Kabat99和"l"位之間的缺口。右側(cè)對齊(表1+圖2):這里同才羊?qū)abat96、97和98位以及Kabat1、m、n、101和102位對齊為方塊形,遵從與針對左側(cè)對齊所描述的同樣的考慮因素。首先,用aa填充前三個和后五個位置后,右側(cè)對齊從Kabat'T位開始,接連填滿KabatT'和99位之間的缺口。中間對齊(表l+圖3a、3b、3c):關(guān)于結(jié)構(gòu)方面,對稱對齊是對齊的首選類型,另外對稱對齊允許進(jìn)行環(huán)中相互作用氨基酸的快速識別。在這里,新的氨基酸對稱地加入某些位點。對稱對齊在AHO123位的中間進(jìn)行,如在"Yetanothernumberingschemeforimmunoglobulinvariabledomains:anautomaticmodelingananalysistool"(免疫球蛋白可變區(qū)的另一種編號方式,即分析工具的自動建模)(A.Honegger,A.Pltickthun,J.Mol.Biol(2001)309,657-670)中所描述。有兩種對稱對齊是可能的一種對齊是,在123位設(shè)置一個缺口,將序列轉(zhuǎn)移到框架區(qū),另一種對齊是將序列以123位為對稱軸向123位轉(zhuǎn)換,將序列分割成具有相同數(shù)目氨基酸的兩個部分。第一種對齊描述了側(cè)翼區(qū)氬基酸的分布(圖3a),而第二種對齊描述了H-CDR3區(qū)域中的環(huán)端(圖3b),當(dāng)然也可以采用同樣的序列并以另一種方法排列。對于環(huán)來講,新的氛基酸在環(huán)的基礎(chǔ)上對稱加入。在混合中間對齊中(圖3c),序列朝向AHO123位對稱對齊,但是結(jié)合了環(huán)和側(cè)翼區(qū)的對齊。圍繞123位的五個氨基酸的方塊保持恒定,但是其他的序列被安排進(jìn)側(cè)翼區(qū)??梢杂糜诳贵w可變區(qū)的編號系統(tǒng)的示例如圖4所示。表2顯示的是4-7個氨基酸長度H-CDR3區(qū)域的中間對齊(側(cè)翼區(qū))結(jié)果。"全部"代表半胱氨酸以外的全部19個氨基酸等量分布。<table>tableseeoriginaldocumentpage29</column></row><table>表2:4-7個氨基酸長度H-CDR3區(qū)域的中間對齊'天然氨基酸分布表3顯示的是4-7個氨基酸長度H-CDR3區(qū)域的中間對齊(環(huán)區(qū))結(jié)果。"全部"代表半胱氨酸以外的全部19個氨基酸等量分布。所有序列結(jié)果環(huán)區(qū),H-CDR3,4aa-7aa<table>tableseeoriginaldocumentpage30</column></row><table>表3:4-7個氨基酸長度H-CDR3區(qū)域的中間對齊。表4顯示的是4-7個氨基酸長度H-CDR3區(qū)域的左側(cè)對齊結(jié)果。"全部,代表半胱氨酸以外的全部19個氨基酸等量分布。<table>tableseeoriginaldocumentpage31</column></row><table>表4:4-7個氨基酸長度H-CDR3區(qū)域的左側(cè)對豸表5顯示的是4-7個氨基酸長度H-CDR3區(qū)域的右側(cè)對齊結(jié)果。"全部,代表半胱氨酸以外的全部19個氨基酸等量分布。<table>tableseeoriginaldocumentpage32</column></row><table>表5:4:個氨基酸長度H-CDR3區(qū)域的右側(cè)對齊:表6顯示的是8-14個氨基酸長度H-CDR3區(qū)域的中間對齊(側(cè)翼區(qū))結(jié)果。"全部"代表半胱氨酸以外的全部19個氨基酸等量分布。表7顯示的是8-14個氨基酸長度H-CDR3區(qū)域的中間對齊(環(huán)區(qū))結(jié)果。"全部"代表半胱氨酸以外的全部19個氨基酸等量分布。表8顯示的是8-14個氨基酸長度H-CDR3區(qū)域的中間對齊(混合中間)結(jié)果。"全部"代表半胱氨酸以外的全部19個氨基酸等量分布。表9顯示的是8-14個氨基酸長度H-CDR3區(qū)域的左側(cè)對齊結(jié)果。"全部"代表半胱氨酸以外的全部19個氨基酸等量分布。表10顯示的是8-14個氨基酸長度H-CDR3區(qū)域的右側(cè)對齊結(jié)果。"全部,,代表半胱氨酸以外的全部19個氨基酸等量分布。表11顯示的是15-23個氨基酸長度H-CDR3區(qū)域的中間對齊(側(cè)翼區(qū))結(jié)果。"全部"代表半胱氨酸以外的全部19個氨基酸等量分布。表12顯示的是15-23個氨基酸長度H-CDR3區(qū)域的中間對齊(環(huán)區(qū))結(jié)果。"全部,,代表半胱氨酸以外的全部19個氨基酸等量分布。表13顯示的是15-23個氨基酸長度H-CDR3區(qū)域的中間對齊(混合中間)結(jié)果。"全部"代表半胱氨酸以外的全部19個氨基酸等量分布。表14顯示的是15-23個氨基酸長度H-CDR3區(qū)域的左側(cè)對齊結(jié)果。"全部"代表半胱氨酸以外的全部19個氨基酸等量分布。表15顯示的是15-23個氨基酸長度H-CDR3區(qū)域的右側(cè)對齊結(jié)果。"全部"代表半胱氨酸以外的全部19個氨基酸等量分布。<table>tableseeoriginaldocumentpage34</column></row><table><table>tableseeoriginaldocumentpage35</column></row><table><image>imageseeoriginaldocumentpage36</image><table>tableseeoriginaldocumentpage37</column></row><table><table>tableseeoriginaldocumentpage38</column></row><table>表10:8-14個氨基酸長度H-CDR3區(qū)域的右側(cè)對齊。<table>tableseeoriginaldocumentpage39</column></row><table><table>tableseeoriginaldocumentpage40</column></row><table><table>tableseeoriginaldocumentpage41</column></row><table>表13:15-23個氨基酸長度H-CDR3區(qū)域的中間對齊。<image>imageseeoriginaldocumentpage42</image>表14:15-23個氨基酸長度H-CDR3區(qū)域的左側(cè)對齊。<table>tableseeoriginaldocumentpage43</column></row><table>表15:15-23個氨基酸長度H-CDR3區(qū)域的右側(cè)對齊。200680053024.7轉(zhuǎn)溢也被35/41:H在另一個非限制性的示例中,本發(fā)明提供了一種具有不同長度的多樣化H-CDR3區(qū)域的集合,其中根據(jù)第一個多樣化因素,H-CDR3區(qū)域的多樣性由將長度為約4到約8個氨基酸的在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化而產(chǎn)生,其中第一個多樣化因素要求1位上丙氨酸的頻率為約80%,2位上精氨酸的頻率為約60%,3位上甘氨酸的頻率為約40%,7位上天冬氨酸的頻率為約50%,8位上酪氨酸的頻率為約40%(表16)。s齒位森HG0R32:'3::4多T...8.、R:節(jié)19:德C:1&由.C:物'^Wfc:'K::D'輸.Y恥.表16:該表顯示的是將長度為約4到約8個氨基酸的在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化的多樣化因素示例。在另一個非限制性的示例中,本發(fā)明提供了一種具有不同長度的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中根據(jù)第一個多樣化因素,H-CDR3區(qū)域的多樣性由將長度為約9到約15個氨基酸的在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化而產(chǎn)生,其中第一個多才羊化因素要求1位上丙氨酸的頻率為約90%,2位上精氨酸的頻率為約70%,10位上酪氨酸的頻率為約20%,11位上酪氨酸的頻率為約20%,12位上酪氨酸的頻率為約30%,13位上苯丙氨酸的頻率為約60%,14位上天冬氨酸的頻率為約80%,15位上酪氨酸的頻率為約40%。優(yōu)選的是,氨基酸長度為約9到約15個氨基酸的人類或者人源化H-CDR3區(qū)域的多樣性由H-CDR3區(qū)域中高含量的甘氨酸和絲氨酸產(chǎn)生(表17)。<image>imageseeoriginaldocumentpage44</image>表17:該表顯示的是將長度為約9到約15個氨基酸的在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化的多樣化因素示例。在另一個非限制性的示例中,本發(fā)明提供了一種具有不同長度的多樣化人類或人源化抗體H-CDR3區(qū)域的集合,其中根據(jù)第一個多樣化因素,H-CDR3區(qū)域的多樣性由將長度為約16到約22個氨基酸的H-CDR3區(qū)域多樣化而產(chǎn)生,其中第一個多樣化因素要求1位上丙氨酸的頻率為約90%,2位上精氨酸的頻率為約60%,3位上天冬氨酸的頻率為約30%,4位上甘氨酸的頻率為約20%,5位上精氨酸的頻率為約10%,6位上精氨酸的頻率為約10%,7位上酪氨酸的頻率為約20%,15位上酪氨酸的頻率為約40%,16位上酪氨酸的頻率為約50%,17位上酪氨酸的頻率為約50%,18位上酪氨酸的頻率為約60%,19位上酪氨酸的頻率為約40%,20位上曱硫氨酸的頻率為約50%,21位上天冬氨酸的頻率為約95%,22位上纈氨酸的頻率為約60%(表18)。<formula>formulaseeoriginaldocumentpage45</formula>表18:該表顯示的是將長度為約16到約22個氨基酸的在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化的多樣化因素示例。此外,氨基酸長度為約16到約22個氨基酸的人類或者人源化H-CDR3區(qū)域集合的多樣性由H-CDR3區(qū)域中高含量的絲氨酸、H-CDR3區(qū)域末端部分(C末端)高含量的堿性氨基酸、H-CDR3區(qū)域前端部分(N端)的天冬氨酸和整個H-CDR3區(qū)域中高含量的芳香氨基酸產(chǎn)生。在本發(fā)明的上下文中,應(yīng)理解,對于H-CDR3區(qū)域中任意給定的氨基酸位點,指定氨基酸位點上沒有指定頻率的氨基酸的出現(xiàn)率大致是均等的,或者這種位點上某些氨基酸比其他氨基酸具有更高的頻率,在某些情況下,在一個或多個指定氨基酸位置上,某些氨基酸會被排除(例如半胱氨酸)。在本發(fā)明的上下文中,通過在編碼H-CDR3的DNA序列中偏倚完全隨機(jī)的氨基酸分布,來模擬已知天然氨基酸的分布,從而實現(xiàn)了多樣化H-CDR3區(qū)域的設(shè)計。多樣化H-CDR3區(qū)域的產(chǎn)生利用三核苷酸誘變(TRIM)技術(shù)(Virnekas等,1994)進(jìn)行,這種技術(shù)可以任意在單個位點合成任何需要的混合氨基酸,因此可以在任何位點引入任意的氨基酸偏倚(bias)。一般而言,TRIM技術(shù)依靠利用預(yù)先裝配的三核苷酸作為標(biāo)準(zhǔn)DNA合成的輸入物,由此避免了移碼、終止密碼子或者不需要的氨基酸,從而產(chǎn)生大量的序列多樣性。因此,產(chǎn)生足夠大的功能序列空間需要非常大的庫。相應(yīng)地,關(guān)于長度依賴的氨基酸組成的知識結(jié)合TRIM技術(shù),可以設(shè)計出具有更高功能含量的更小的H-CDR3區(qū)域集合。另一方面,本發(fā)明提供了一種包含多樣化H-CDR3區(qū)域集合的多樣化人類或者人源化抗體可變重鏈的集合,其中每個H-CDR3區(qū)域的多樣性由如下產(chǎn)生根據(jù)第一個多樣化因素將長度在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第二個多樣化因素將長度在第二氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,其中每個多樣化因素是每個H-CDR3區(qū)域氨基酸長度的函數(shù)。而且,本發(fā)明提供了一種多樣化人類或者人源化抗體或其功能片段的集合,根據(jù)本發(fā)明,集合中每個成員包含一個人類或者人源化抗體的可變重鏈。在本發(fā)明的上下文中,應(yīng)理解,為了產(chǎn)生多樣化人類或者人源化抗體或其功能片段的集合,本領(lǐng)域技術(shù)人員將可以修改多樣化H-CDR3區(qū)域集合的理論設(shè)計。本領(lǐng)域技術(shù)人員應(yīng)理解例如通過加入那些在彼此相同摩爾濃度時表現(xiàn)出低于這種頻率的氨基酸的方法,在氨基酸以低頻率出現(xiàn)方面(例如氨基酸的頻率低于5%或者優(yōu)選低于3%)修改設(shè)計是可以接受的;這樣一來,多樣化人類或者人源化抗體或其功能片段的集合可以通過包括這個濃度下這些氨基酸的混合物而產(chǎn)生。另一方面,本發(fā)明提供了一種包含多樣化人類或者人源化抗體或其功能片段集合的、合成的人類或者人源化抗體庫。合成的共有序列可以覆蓋人類基因組編碼的抗體的結(jié)構(gòu)譜。合成的人類或者人源化抗體庫可以基于抗體或抗體片段,優(yōu)選Fv,二硫化物連接的Fv,單鏈Fv(scFv)或者Fab片段,這些可以作為對抗新的靶抗原的特異性來源。在本發(fā)明的上下文中,合成的人類或者人源化抗體庫建立在計算機(jī)設(shè)計、合成核酸編碼的氨基酸序列的基礎(chǔ)上。例如,抗體序列的計算機(jī)設(shè)計是通過分析人類序列的數(shù)據(jù)庫并用由此得到的數(shù)據(jù)設(shè)計多肽序列而實現(xiàn)的。通過分析已知基因種系人類免疫球蛋白可變區(qū)的氨基酸序列,抗體基因可以根據(jù)序列同源性和標(biāo)準(zhǔn)結(jié)構(gòu)分成多個亞家族(Chothia等,1992;Tomlinson等,1995)。由于氨基酸序列的高同源性和屬于一個亞家族標(biāo)準(zhǔn)結(jié)構(gòu),7VH和7VL共有序列(主宰基因)可以被設(shè)計并結(jié)合產(chǎn)生49個主宰框架結(jié)合(Knappik等,2000)。主宰基因可以化學(xué)合成,從而通過引入所有的功能模塊側(cè)翼的獨特性限制位點,產(chǎn)生完全模塊化的基因結(jié)構(gòu)。設(shè)計和得到計算機(jī)創(chuàng)建序列的方法有描述,例如Knappik等,J.Mol.Biol.(2000)296:57;Krebs等,J.Immunol.Methods.(2001)254:67;以及授予Knappik等的美國專利第6,300,064號,在此全部通過引用并入本文。另一方面,本發(fā)明提供了一種編碼多樣化人類或者人源化H-CDR3區(qū)域的核酸分子集合的制備方法。例如,這可通過合成多個DNA分子進(jìn)行,其中每個DNA分子編碼一個H-CDR3區(qū)域,且其中所述H-CDR3區(qū)域具有不同的范圍。為此目的,根據(jù)第一個多樣化因素,合成編碼第一氨基酸范圍內(nèi)H-CDR3區(qū)域的DNA分子;根據(jù)第二個多樣化因素,合成編碼第二氨基酸范圍內(nèi)H-CDR3區(qū)域的DNA分子,這些多樣化因素是不同的。一方面,本發(fā)明提供了一種編碼氨基酸范圍不同的、多樣化人類或者人源化抗體H-CDR3區(qū)域集合的核酸集合,其中所述集合的多樣性由如下產(chǎn)生根據(jù)第一個多樣化因素將長度在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第二個多樣化因素將長度在第二氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,其中所述多樣化因素是不同的。本發(fā)明還提供了得到多樣化人類或者人源化抗體H-CDR3區(qū)域的集合的方法。根據(jù)本發(fā)明,這可以通過表達(dá)編碼多樣化人類或者人源化抗體H-CDR3區(qū)域集合的核酸集合來實現(xiàn)。另一方面,本發(fā)明提供了識別一個或多個基因的方法,這些基因編碼本發(fā)明中的一個或多個H-CDR3區(qū)域,而H-CDR3區(qū)域結(jié)合給定革巴點。這可以例如通過表達(dá)H-CDR3區(qū)域,然后對它們進(jìn)行篩選以分離出一個或多個結(jié)合給定靶分子的H-CDR3區(qū)域來實現(xiàn)。H-CDR3區(qū)域可以包含在抗體可變重鏈內(nèi)。篩選可以利用本領(lǐng)域技術(shù)人員熟知的方法之一進(jìn)行,例如噬菌體展示或者半胱氨酸展示技術(shù)(Cysdisplay)(例如美國專利第6,753,136號中描述)。在本發(fā)明的上下文中,人類或者人源化抗體庫可以建立在來自人類供體基因片段和設(shè)計合成DNA相結(jié)合的基礎(chǔ)上。例如,人類供體來源的編碼輕鏈可變區(qū)和一系列重鏈區(qū)的片段與合成的DNA結(jié)合,這些合成的DNA編碼在特定位點引入多樣性的人類抗體序列。正如這里公開的,本發(fā)明還提供了來源于抗體或其片段的變異或者優(yōu)化了的抗體(或其片段)??贵w包含兩條肽鏈,每一條包含一個(輕鏈)或三個(重鏈)的恒定區(qū)以及一個可變區(qū)(VL、VH),后者在各種情況下均由四個FR區(qū)和三個間隔的CDR構(gòu)成??乖Y(jié)合位點由一個或多個CDR形成,而FR區(qū)為CDR提供結(jié)構(gòu)框架,并且在抗原結(jié)合中也起著重要的作用。通過改變CDR或FR區(qū)的一個或多個氨基酸殘基,本領(lǐng)域技術(shù)人員能夠常規(guī)地生產(chǎn)出變異或多樣化的抗體序列,這些序列可以通過抗原來篩選,例如篩選出新的或改進(jìn)的特性。此外,這里提到的"免疫球蛋白"(Ig)定義為隸屬IgG,IgM,IgE,IgA或IgD類(或其任何亞類)的一種蛋白質(zhì),其包括所有常規(guī)已知的抗體和其功能片段??贵w/免疫球蛋白的"功能片段"由此定義為保留抗原結(jié)合區(qū)的抗體/免疫球蛋白(例如IgG的可變區(qū))的片段??贵w的"抗原結(jié)合區(qū)"通常位于抗體的一個或多個高變區(qū)中,即CDR-1、-2和/或-3區(qū);但是可變"框架區(qū)"在抗原結(jié)合中也起著重要的作用,例如為CDR提供支架。優(yōu)選的是,"抗原結(jié)合區(qū)"包含至少可變輕鏈(VL)的4-103個氨基酸殘基和可變重鏈(VH)的5-109個氨基酸殘基,更優(yōu)選的是,包含可變輕鏈(VL)的3-107個氨基酸殘基和可變重鏈(VH)的4-111個氨基酸殘基,尤其優(yōu)選的是,全部的輕鏈和重鏈(輕鏈的氨基酸1-109位和重鏈的1-113位;根據(jù)WO97/08320編號)。本發(fā)明中使用的優(yōu)選的免疫球蛋白類別為IgG。本發(fā)明的"功能片段"包括F(ab,)2片段,F(xiàn)ab片段和scFv的區(qū)域。F(ab,)2或Fab可以被改造,用來減小或完全消除CH1和CL域間發(fā)生的分子間二硫《建相互作用。這里提到術(shù)語"高變區(qū)"時,是指負(fù)責(zé)與抗原結(jié)合的、抗體的氨基酸殘基。高變區(qū)包含來自"互補(bǔ)決定區(qū)"或"CDR,,的氨基酸殘基[即輕鏈可變區(qū)中殘基24-34(Ll)、50-56(L2)和89-97(L3)以及重鏈可變區(qū)中31-35(H1)、50-65(H2)和95-102(H3);Kabat等,SequencesofProteinsofImmunologicalInterest,5thEd.PublicHealthService,NationalInstitutesofHealth,Bethesda,Md.(1991)]和/或那些來自"高變環(huán)"的殘基[即輕鏈可變區(qū)中殘基26誦32(L1)、50-52(L2)和91-96(L3)以及重鏈可變區(qū)中26-32(Hl)、53-55(H2)和96-101(H3);Chothia&LeskJ.Mol,Biol.196:901-917(1987)]。"框架"或"FR"殘基是不同于這里定義的高變區(qū)殘基的可變區(qū)殘基。"人類"抗體或功能性人類抗體片段由此定義為非嵌合的(例如非"人源化的")和(全部或部分)不是來自非人物種的。人類抗體或功能性抗體片段可以來源于人類或者是合成的人類抗體。"合成的人類抗體"在這里定義為具有全部或部分序列來自計算機(jī)合成序列的抗體,這些合成序列是在分析已知人類抗體序列的基礎(chǔ)上得到的。舉例來說,計算機(jī)設(shè)計人類抗得到的數(shù)據(jù)設(shè)計多肽序列來實現(xiàn)的。人類抗體或功能性抗體片段的另一個例子是,由人源抗體序列庫(即這種庫建立在人類自然來源提取抗體的基礎(chǔ)上)中分離出的核酸編碼得來的抗體或功能性片段。"人源化抗體"或功能性人源化抗體片段在這里定義為(i)是至少部分來自非人類來源(例如帶有異源免疫系統(tǒng)的轉(zhuǎn)基因小鼠),抗體建立在人類基因種系序列的基礎(chǔ)上;或(ii)是嵌合的,其中可變區(qū)至少有一部分是非人類來源的,恒定區(qū)是人類來源的;或(iii)是CDR移植的,其中可變區(qū)CDR至少有一部分是非人類來源的,而一個或多個可變區(qū)框架是人類來源的以及恒定區(qū)(如果有的話)是人類來源的。權(quán)利要求1.一種氨基酸范圍可變的、多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中該集合的多樣性由如下產(chǎn)生根據(jù)第一個多樣化因素將長度在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,以及根據(jù)第二個多樣化因素將長度在第二氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,其中所述多樣化因素是不同的。2.根據(jù)權(quán)利要求1所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述H-CDR3區(qū)域至少有一部分的長度范圍為約4到約22個氨基酸。3.根據(jù)權(quán)利要求2所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述第一氨基酸范圍具有約4到約13個氨基酸,且其中所述第二氨基酸范圍具有約14到約22個氨基酸。4.根據(jù)權(quán)利要求1所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述集合的多樣性由如下產(chǎn)生根據(jù)第一個多樣化因素將長度在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第二個多樣化因素將長度在第二氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,以及根據(jù)第三個多樣化因素將長度在第三氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,其中所述多樣化因素是不同的。5.根據(jù)權(quán)利要求4所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述第一氨基酸范圍具有約4到約9個氛基酸,其中所述第二氨基酸范圍具有約10到約16個氨基酸,并且其中所述第三氨基酸范圍具有約17到約22個氨基酸。6.根據(jù)權(quán)利要求1所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述集合的多樣性由如下產(chǎn)生根據(jù)第一個多樣化因素將長度在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第二個多樣化因素將長度在第二氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第三個多樣化因素將長度在第三氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第四個多樣化因素將長度在第四氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第五個多樣化因素將長度在第五tt酸范圍內(nèi)的H-CDR3區(qū)域多樣化,以及根據(jù)第六個多樣化因素將長度在第六氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,其中所述多樣化因素是不同的。7.根據(jù)權(quán)利要求6所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述第一氨基酸范圍具有約4到約6個氨基酸,其中所述第二^基酸范圍具有約7到約9個氨基酸,其中所述第三氨基酸范圍具有約10到約12個氨基酸,其中所述第四氨基酸范圍具有約13到約15個氨基酸,其中所述第五氨基酸范圍具有約16到約18個氨基酸,且其中所述第六氨基酸范圍具有約19到約22個氨基酸。8.根據(jù)權(quán)利要求1所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述集合的多樣性由如下產(chǎn)生根據(jù)第一個多樣化因素將長度在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第二個多樣化因素將長度在第二氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第三個多樣化因素將長度在第三氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第四個多樣化因素將長度在笫四氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第五個多樣化因素將長度在第五氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第六個多樣化因素將長度在第六氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第七個多樣化因素將長度在第七氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,根據(jù)第八個多樣化因素將長度在第八氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,以及根據(jù)第九個多樣化因素將長度在第九氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,其中所述多樣化因素是不同的。9.根據(jù)權(quán)利要求8所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述第一氨基酸范圍具有約4到約5個氨基酸,所述第二氨基酸范圍具有約6到約7個氨基酸,所述第三氨基酸范圍具有約8到約9個氨基酸,所述第四氨基酸范圍具有約IO到約11個氨基酸,所述第五氨基酸范圍具有約12到約13個氨基酸,所述第六氨基酸范圍具有約14到約15個氨基酸,所述第七氛基酸范圍具有約16到約17個氨基酸,所述第八氨基酸范圍具有約18到約19個氨基酸,且其中所述第九氨基酸范圍具有約20到約22個氨基酸。10.根據(jù)權(quán)利要求2所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述第一范圍具有約4到約8個氨基酸,且其中所述第一個多樣化因素要求1位上丙氨酸的頻率為約80%,2位上精氨酸的頻率為約60%,3位上甘氨酸的頻率為約40%,7位上天冬氨酸的頻率為約50%,以及8位上酪氨酸的頻率為約40%。11.根據(jù)權(quán)利要求2所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述第一范圍具有約9到約15個氨基酸,且其中所述第一個多樣化因素要求1位上丙氨酸的頻率為約90%,2位上精氨酸的頻率為約70%,10位上酪氨酸的頻率為約20%,11位上酪氨酸的頻率為約20%,12位上酪氨酸的頻率為約30%,13位上苯丙氨酸的頻率為約60%,14位上天冬氨酸的頻率為約80%,15位上酪氨酸的頻率為約40%。12.根據(jù)權(quán)利要求2所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述第一范圍具有約16到約22個氨基酸,且其中所述第一個多樣化因素要求1位上丙氨酸的頻率為約90%,2位上精氨酸的頻率為約60%,3位上天冬氨酸的頻率為約30%,4位上甘氨酸的頻率為約20%,5位上精氨酸的頻率為約10%,6位上精氨酸的頻率為約10%,7位上酪氨酸的頻率為約20%,15位上酪氨酸的頻率為約40%,16位上酪氨酸的頻率為約50%,17位上酪氨酸的頻率為約50%,18位上酪氨酸的頻率為約60%,19位上酪氨酸的頻率為約40%,20位上甲硫氨酸的頻率為約50%,21位上天冬氨酸的頻率為約95%,22位上纈氨酸的頻率為約60%。13.根據(jù)權(quán)利要求2所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述第一范圍具有約9到約15個氨基酸,且其中所述第一個多樣化因素要求所述第一范圍中至少有兩個氨基酸位點上具有高含量的甘氨酸和絲氨酸。14.根據(jù)權(quán)利要求2所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述第一范圍具有約16到約22個氨基酸,且其中所述第一個多樣化因素要求(i)所述第一范圍中至少有一個氨基酸位點上具有高含量的絲氨酸,(ii)所述H-CDR3區(qū)域末端部分中具有高含量的堿性氨基酸,(iii)所述H-CDR3前端部分中具有高含量的天冬氨酸和(iv)所述第一范圍中至少有兩個氨基S臾位點上具有高含量的芳香氨基酸。15.根據(jù)權(quán)利要求2所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述第一范圍具有約5個氨基酸,且其中所述第一個多樣化因素要求1位上丙氨酸的頻率為約60%,蘇氨酸的頻率為約20%和除半胱氨酸外的所有其他氨基酸的頻率為約0.58%;2位上精氨酸的頻率為約30%,賴氨酸的頻率為約30%,蘇氨酸的頻率為約30%和除半胱氨酸外的所有其他氨基酸的頻率為約0.55%;3位上天冬氨酸的頻率為約40%,苯丙氨酸的頻率為約40%和除半胱氨酸外的所有其他氨基酸的頻率為約0.58%;4位上天冬氨酸的頻率為約30%,甘氨酸的頻率為約30%,甲硫氨酸的頻率為約30%和除半胱氨酸外的所有其他氨基酸的頻率為約0.63%以及5位上酪氨酸的頻率為約30%,天冬氨酸的頻率為約30%和除半胱氨酸外的所有其他氨基酸的頻率為約0.58%。16.根據(jù)權(quán)利要求2所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述第一范圍具有約12個氨基酸,且其中所述第一個多樣化因素要求l位上丙氨酸的頻率為約80%,蘇氨酸和纈氨酸總共的頻率為約15%;2位上精氨酸的頻率為約70%,絲氨酸、蘇氨酸、甘氨酸和丙氨酸總共的頻率是約30%;9位上丙氨酸、絲氨酸和酪氨酸總共的頻率為約20%以及除半胱氨酸外的所有其他氨基酸的頻率為約0.63%;10位上苯丙氨酸的頻率為約60%,曱硫氨酸的頻率為約10%和除半胱氨酸外的所有其他氨基酸的頻率為約0.58%;11位上天冬氨酸的頻率為約80%,甘氨酸的頻率為約5%和除半胱氨酸外的所有其他氨基酸的頻率為約0.58%以及12位上酪氨酸的頻率為約50%,纈氨酸和異亮氨酸總共的頻率為約10%和除半胱氨酸外的所有其他氨基酸的頻率為約0.63%。17.根據(jù)權(quán)利要求2所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合,其中所述第一范圍具有約20個氨基酸,且其中所迷第一個多樣化因素要求1位上丙氨酸的頻率為約100%;2位上精氨酸的頻率為約50%和賴氨酸的頻率為約50%;3位上甘氨酸的頻率為約30%和除半胱氨酸外的所有其他氨基酸的頻率為約0.55%;4位上精氨酸的頻率為約20%,甘氨酸的頻率為約20%,亮氨酸的頻率為約20%和除半胱氨酸外的所有其他氨基酸的頻率為約0.63%;14位上絲氨酸的頻率為約20%,蘇氨酸的頻率為約20%,半胱氨酸的頻率為約20%和除半胱氨酸外的所有其他氨基酸的頻率為約0.63%;21位上天冬氨酸的頻率為約95%以及22位上纈氨酸的頻率為約50%和除半胱氨酸外的所有其他氨基酸的頻率為約0.55%。18.—種多樣化人類或者人源化抗體可變重鏈的集合,其包含根據(jù)權(quán)利要求1的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合。19.一種多樣化人類或者人源化抗體或其功能性片段的集合,其包含根據(jù)權(quán)利要求18的人類或者人源化抗體可變重鏈的集合。20.—種合成的人類或者人源化抗體庫,其包含根據(jù)權(quán)利要求19的多樣化人類或者人源化抗體或其功能性片段的集合。21.—種編碼范圍可變的多樣化人類或者人源化H-CDR3區(qū)域的核酸分子集合的制備方法,其包含以下步驟合成多個DNA分子,其中每個DNA分子編碼一個H-CDR3區(qū)域,所述H-CDR3區(qū)域具有不同的范圍,其中根據(jù)第一個多樣化因素,合成編碼第一氨基酸范圍的H-CDR3區(qū)域的DNA分子;以及根據(jù)第二個多樣化因素,合成編碼第二氨基酸范圍的H-CDR3區(qū)域的DNA分子,其中所述多樣化因素是不同的。22.—種編碼多樣化人類或者人源化抗體H-CDR3區(qū)域集合的核酸集合,其根據(jù)權(quán)利要求21的方法生產(chǎn)。23.—種編碼氨基酸范圍可變的、多樣化人類或者人源化抗體H-CDR3區(qū)域集合的核酸集合,其中所述集合的多樣性由如下產(chǎn)生根據(jù)第一個多樣化因素將長度在第一氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,以及根據(jù)第二個多樣化因素將長度在第二氨基酸范圍內(nèi)的H-CDR3區(qū)域多樣化,其中所述多樣化因素是不同的。24.—種得到根據(jù)權(quán)利要求1所述的多樣化人類或者人源化抗體H-CDR3區(qū)域的集合的方法,所述方法包含以下步驟表達(dá)根據(jù)權(quán)利要求22或23的核酸集合。25.根據(jù)權(quán)利要求1所述的多樣化人類或者人源化H-CDR3區(qū)域的集合,其中如果所述集合中的成員長度是4-8個氨基酸,那么應(yīng)用于所述長度是4-8個氨基酸的所述成員的所述多樣化因素在具有所述長度的所述成員的所述H-CDR3區(qū)域中定義了0,1,2或3個恒定的氨基酸位點。26.根據(jù)權(quán)利要求1所述的多樣化人類或者人源化H-CDR3區(qū)域的集合,其中如果所述集合中的成員長度是9-10個氨基酸,那么應(yīng)用于所述長度是9-10個氨基酸的所述成員的所述多樣化因素在具有所述長度的所述成員的所述H-CDR3區(qū)域中定義了0,1,2或3個恒定的氨基酸位點。27.根據(jù)權(quán)利要求1所述的多樣化人類或者人源化H-CDR3區(qū)域的集合,其中如果所述集合中的成員長度是11-13個氨基酸,那么應(yīng)用于所述長度是11-13個氨基酸的所述成員的所述多樣化因素在具有所述長度的所述成員的所述H-CDR3區(qū)域中定義了0,1,2或3個恒定的氨基酸位點。28.根據(jù)權(quán)利要求1所述的多樣化人類或者人源化H-CDR3區(qū)域的集合,其中如果所述集合中的成員長度是14個氨基酸,那么應(yīng)用于所述長度是14個氨基酸的所述成員的所述多樣化因素在具有所述長度的所述成員的所迷H-CDR3區(qū)域中定義了0,1,2,3,4或5個恒定的氨基酸位點。29.根據(jù)權(quán)利要求1所述的多樣化人類或者人源化H-CDR3區(qū)域的集合,其中如果所述集合中的成員長度是15-16個氨基酸,那么應(yīng)用于所述長度是15-16個氨基酸的所迷成員的所述多樣化因素在具有所迷長度的所述成員的所述H-CDR3區(qū)域中定義了0,1,2,3,4,5,6,7或8個恒定的氨基酸位點。30.根據(jù)權(quán)利要求1所述的多樣化人類或者人源化H-CDR3區(qū)域的集合,其中如果所述集合中的成員長度是16-17個氨基酸,那么應(yīng)用于所述長度是16-17個氨基酸的所述成員的所述多樣化因素在具有所述長度的所述成員的所述H-CDR3區(qū)域中定義了0,1,2,3,4,5,6,7或8個恒定的氨基酸位點。31.根據(jù)權(quán)利要求1所述的多樣化人類或者人源化H-CDR3區(qū)域的集合,其中如果所述集合中的成員長度是18個氨基酸,那么應(yīng)用于所述長度是]8個氨基酸的所述成員的所述多樣化因素在具有所述長度的所述成員的所述H-CDR3區(qū)域中定義了0,1,2,3,4,5,6,7或8個恒定的氨基酸位點。32.根據(jù)權(quán)利要求1所述的多樣化人類或者人源化H-CDR3區(qū)域的集合,其中如杲所述集合中的成員長度是19個或更多氨基酸,那么應(yīng)用于所述長度是19個或更多氨基酸的所述成員的所述多樣化因素在具有所述長度的所述成員的所述H-CDR3區(qū)域中定義了0,1,2,3,4,5,6或7個恒定的氨基酸位點。全文摘要本發(fā)明涉及抗體重鏈互補(bǔ)決定區(qū)3(HCDR3)成員集合的制備和應(yīng)用,這個集合的多樣性是HCDR3成員長度的函數(shù)。HCDR3區(qū)域集合的多樣性大體上代表了人HCDR3譜中天然氨基酸的分布。因此,在編碼HCDR3的DNA序列中利用三核苷酸誘變(TRIM)技術(shù)偏倚完全隨機(jī)分布的氨基酸可以描繪這種天然氨基酸的分布。本發(fā)明HCDR3集合中的每一個成員,都可以包含在抗體可變區(qū)(或者其片段)中,以形成合成的抗體或者抗體片段庫。本發(fā)明中的合成抗體庫可以設(shè)計成包含一些模塊的特性,例如化學(xué)合成的“主宰基因”框架區(qū),這個框架區(qū)可能含有一個或多個CDR區(qū)域側(cè)翼的獨特限制性位點,包括按這里描述制備的HCDR3區(qū)域。本發(fā)明還提供了編碼這種多樣化集合的核酸分子,和制備使用所述核酸分子的方法。文檔編號C40B40/10GK101389655SQ200680053024公開日2009年3月18日申請日期2006年12月15日優(yōu)先權(quán)日2005年12月20日發(fā)明者克里斯廷·羅斯,斯特法妮·尤林格,斯特法妮·特爾喬瑟夫·普拉斯勒,馬庫斯·恩澤爾伯格申請人:莫佛塞斯公司