專利名稱::動物膠原和明膠的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及衍生自動物序列的膠原和明膠的重組合成。本發(fā)明還涉及編碼牛和豬膠原的新穎多核苷酸序列,編碼的多肽序列,以及這些序列在重組生產(chǎn)動物膠原和明膠中的用途。
背景技術(shù):
:胞外基質(zhì)最豐富的成分是膠原。膠原是一大類纖維蛋白,特征是存在三鏈螺旋結(jié)構(gòu)域。膠原分子通常是含有(-Gln-X-Y-)n重復(fù)的多肽鏈三聚裝配的結(jié)果,該重復(fù)形成三股螺旋結(jié)構(gòu)域(vanderRest等(1991)FASEBJ.52814-2823)。膠原目前,在脊椎動物中已鑒定出約二十種不同的膠原類型,包括牛、綿羊、豬、雞和人膠原。通常膠原類型用羅馬數(shù)字編號,在每一膠原類型中發(fā)現(xiàn)的鏈用阿拉伯?dāng)?shù)字編號。天然存在的膠原各種不同類型的結(jié)構(gòu)和生物功能的詳細(xì)描述是本領(lǐng)域可得的(見例如,Ayad等(1998)TheExtracellularMatrixFactsBook,AcademicPress,SanDiego,CA;Burgeson,R.E.和Nimmi(1992)“膠原類型分子結(jié)構(gòu)和組織分布”于Clin.Orthop.282250-272;Kielty,C.M.等(1993)“膠原家族胞外基質(zhì)中的結(jié)構(gòu),裝配和組織”ConnectiveTissueAndItsHeritableDisorders,MolecularGenetics,AndMedicalAspects,Royce,P.M.和B.Steinmann編,Wiley-Liss,NY,pp.103-147;和Prockop,D.J.和K.I.Kivirikko(1995)“膠原分子生物學(xué),疾病和治療性能”,Annu.Rev.Biochem.64403-434)。I型膠原是骨骼和皮膚的主要纖維膠原,占生物體全部膠原的約80-90%。I型膠原是多細(xì)胞生物胞外基質(zhì)的主要的結(jié)構(gòu)大分子,占總蛋白質(zhì)量的約20%。I型膠原是異三聚分子,含有兩條α1(I)鏈和一條α2(I)鏈,分別由COL1A1和COL1A2基因編碼。其它膠原類型比I型膠原少,呈現(xiàn)不同的分布情況。例如,II型膠原是軟骨和玻璃液中的主要膠原,而III型膠原以高水平存在于血管中,而在皮膚中較少一些。II型膠原是同三聚(homotrimeric)膠原,含有三條相同的α1(II)鏈,由COL2A1基因編碼。純化的II型膠原可從組織中通過本領(lǐng)域已知的方法,例如Miller和Rhodes(1982)MethodsinEnzymology8233-64所述的方法制備。III型膠原是皮膚和血管組織中的主要纖維膠原。III型膠原是同三聚膠原,含有三條相同的α1(III)鏈,由COL3A1基因編碼。從組織中純化的III型膠原的方法,可在例如Byers等(1974)Biochemistry135243-5248和Miller和Rhodes,見上所述的制備方法中找到。IV型膠原以片層而不是纖維的形式存在于基底膜中。IV型膠原最常見含有兩條α1(IV)鏈和一條α2(IV)鏈。組成IV型膠原的具體鏈?zhǔn)墙M織特異性的。IV型膠原可以用例如Furuto和Miller(1987)MethodsinEnzymology,14441-61,AcademicPress所述的方法純化。V型膠原主要是存在于骨骼、腱、角膜、皮膚和血管中的纖維膠原。V型膠原同時存在同三聚和異三聚形式。V型膠原的一種形式是兩條α1(V)鏈和一條α2(V)鏈的異三聚體。V型膠原的另一種形式是α1(V)、α2(V)和α3(V)鏈的異三聚體。V型膠原的還有一種形式是α1(V)的同三聚體。從天然來源分離V型膠原的方法可在例如Elstow和Weiss(1983)CollagenRel.Res.3181-193和Abedin等(1982)Biosci.Rep.2493-502中找到。VI型膠原具有一個小的三股螺旋區(qū)和兩個大的非膠原剩余部分。VI型膠原是一個異三聚體,含有α1(VI)、α2(VI)和α3(VI)鏈。VI型膠原在許多結(jié)締組織中發(fā)現(xiàn)。可在例如Wu等(1987)Biochem.J.248373-381和Kielty等(1991)J.Cell.Sci.99797-807中找到如何從天然來源純化VI型膠原的描述。VII型膠原是在特定表皮組織中發(fā)現(xiàn)的纖維膠原。VII型膠原是三條α1(VII)鏈的同三聚分子。可在例如Lunstrum等(1986)J.Biol.Chem.2619042-9048和Bentz等(1983)Proc.Natl.Acad.Sci.USA803168-3172中找到如何從組織純化VII型膠原的描述。VIII型膠原存在于在角膜的后界層中。VIII型膠原是異三聚體,含有兩條α1(VIII)鏈和一條α2(VIII)鏈,雖然也報道過其它的鏈成分??稍诶鏐enya和Padilla(1986)J.Biol.Chem.2614160-4169和Kapoor等(1986)Biochemistry253930-3937中找到如何從天然來源純化VIII型膠原的方法。IX型膠原是在軟骨和玻璃液中發(fā)現(xiàn)的纖維結(jié)合的膠原。IX型膠原是異三聚分子,含有α1(IX)、α2(IX)和α3(IX)鏈。IX型膠原被分類為FACIT(纖維結(jié)合的膠原,具有中斷的三股螺旋)膠原,具有幾個由非三股螺旋結(jié)構(gòu)域分隔的三股螺旋結(jié)構(gòu)域??稍诶鏒uance等(1984)Biochem.J.221885-889;Ayad等(1989)BiochemJ.262753-761;和Grant等(1988)TheControloftissueDamage,Glauert,A.M.編,ElsevierSciencePublishers,Amsterdam,pp.3-28中找到純化IX型膠原的方法。X型膠原是α1(X)鏈的同三聚分子。可從生長板的肥大的軟骨中分離出X型膠原。(見例如Apte等(1992)EurJBiochem206(1)217-24.)??稍谲浌墙M織中和身體的其它位置發(fā)現(xiàn)與II型膠原和IX型結(jié)合的XI型膠原。XI型膠原是異三聚分子,含有α1(XI)、α2(XI)和α3(XI)鏈??稍诶鏕rant等,見上述說明中找到純化XI型膠原的方法。XII型膠原是主要與I型膠原結(jié)合的FACIT膠原。XII型膠原是同三聚分子,含有三條α1(XII)鏈??稍诶鏒ublet等(1989)J.Biol.Chem.26413150-13156;Lunstrum等(1992)J.Biol.Chem.26720087-20092;和Watt等(1992)J.Biol.Chem.26720093-20099中找到純化XII型膠原及其變體的方法。XIII型膠原是在皮膚、腸、骨骼、軟骨和橫紋肌等中發(fā)現(xiàn)的非纖維膠原。可在例如Juvonen等(1992)J.Biol.Chem.26724700-24707中發(fā)現(xiàn)XIII型膠原的詳細(xì)描述。XIV型膠原是一種特征為含有α1(XIV)鏈的同三聚分子的FACIT膠原。分離XIV型膠原的方法可在例如Aubert-Foucher等(1992)J.Biol.Chem.26715759-15764和Watt等,見上述說明中發(fā)現(xiàn)。XV型膠原與XVIII型膠原在結(jié)構(gòu)上同源??稍诶鏜yers等(1992)Proc.Natl.Acad.Sci.USA8910144-10148;Huebner等(1992)Genomics14220-224;Kivirikko等(1994)J.Biol.Chem.2694773-4779;和Muragaki,J.(1994)J.Biol.Chem.2644042-4046中發(fā)現(xiàn)有關(guān)天然XV型膠原的結(jié)構(gòu)和分離的信息。XVI型膠原是一種纖維結(jié)合的膠原,存在于皮膚、肺成纖維細(xì)胞和角質(zhì)形成細(xì)胞中??稍赑an等(1992)Proc.Natl.Acad.Sci.USA896565-6569;和Yamaguchi等(1992)J.Biochem.112856-863中發(fā)現(xiàn)XVI型膠原的結(jié)構(gòu)和編碼XVI型基因的信息。XVII型膠原是半橋粒跨膜膠原,也稱為大皰性類天皰瘡抗原??稍诶鏛i等(1993)J.Biol.Chem.268(12)8825-8834;和McGrath等(1995)Nat.Genet.11(1)83-86中發(fā)現(xiàn)XVII型膠原的結(jié)構(gòu)和編碼XVII型膠原的基因的信息。XVIII型膠原在結(jié)構(gòu)上與XV型膠原類似,可從肝臟中分離得到??稍诶鏡ehn和Pihlajaniemi(1994)Proc.Natl.Acad.Sci.USA914234-4238;Oh等(1994)Proc.Natl.Acad.Sci.USA914229-4233;Rehn等(1994)J.Biol.Chem.26913924-13935;和Oh等(1994)Genomics19494-499中發(fā)現(xiàn)從天然來源分離XVIII型膠原及其結(jié)構(gòu)的描述。據(jù)信XIX型膠原是FACIT膠原家族的另一個成員,在橫紋肌肉瘤細(xì)胞分離的mRNA中發(fā)現(xiàn)??稍诶鏘noguchi等(1995)J.Biochem.117137-146;Yoshioka等(1992)Genomics13884-886;和Myers等,J.Biol.Chem.28918549-18557(1994)中發(fā)現(xiàn)XIX性膠原的結(jié)構(gòu)和分離的描述。XX型膠原是FACIT膠原家族新發(fā)現(xiàn)的成員;已在雞角膜中鑒定得到(見例如Gordon等(1999)FASEB雜志13A1119;和Gordon等(1998)IOVS39S1128)。明膠明膠是膠原的衍生物,動物的主要結(jié)構(gòu)和結(jié)締蛋白。明膠衍生自膠原變性,含有具有Gly-X-Y重復(fù)的多肽序列,其中X和Y最常見是脯氨酸和羥脯氨酸殘基。這些序列形成三股螺旋結(jié)構(gòu),影響明膠多肽的凝膠化能力。目前可得的明膠是通過通常是牛和豬來源的動物皮革和骨骼加工提取的。明膠的生物物理性質(zhì)使它成為多用途的材料,廣泛用于各種應(yīng)用和工業(yè)。明膠用于例如許多藥物和醫(yī)學(xué)、照像、工業(yè)、化妝品和食品飲料產(chǎn)業(yè),以及制造過程。因此明膠是商業(yè)上有價值和多用途的產(chǎn)品。明膠通常是用牛和豬來源,特別是從皮革和骨骼中天然存在的膠原制造的。在某些情況下,可從例如魚、雞或馬來源抽提取明膠。典型明膠生產(chǎn)的原料,例如牛皮和骨骼來自經(jīng)過政府認(rèn)證的調(diào)查,并合格適用于人類消費(fèi)的動物。對于該原料的感染性有關(guān)注,因?yàn)榇嬖谖廴疽蜃永缈蓚鞑サ暮>d狀腦病(TSE),特別是牛海綿狀腦病(BSE)和羊瘙癢病等(見例如Rohwer,R.G.(1996)DevBiolStand88247-256)。這種問題對于用于藥物和醫(yī)學(xué)用途的明膠尤其關(guān)鍵。近來,對于這些材料(其中大部分來自牛來源)的安全性的關(guān)注增加了,導(dǎo)致各種含明膠的產(chǎn)品成為幾項管理標(biāo)準(zhǔn)的焦點(diǎn),來減少與新變種克-雅氏病(nvCJD),一種致命的人神經(jīng)疾病有關(guān)的牛海綿狀腦病(BSE)傳播的潛在危險。有擔(dān)心目前用于從動物組織和骨骼提取明膠的方法的純化步驟不足以除去感染性,因?yàn)槲廴緮y帶SE的組織(如腦組織等)。美國和歐洲制造商規(guī)定在動物或人的食品或藥物、醫(yī)學(xué)或化妝品應(yīng)用的明膠原料不能是來自數(shù)量正在增加的BSE國家的。另外,管理部門規(guī)定在明膠生產(chǎn)中不能使用某些材料,例如牛腦組織。目前的生產(chǎn)過程涉及幾個純化和清潔步驟,可能需要嚴(yán)厲和冗長的提取模式。用熬煉法處理動物皮毛和骨骼,提取的材料經(jīng)過各種化學(xué)處理,包括長時間接觸高酸性或堿性溶液。許多純化步驟涉及洗滌和過濾以及各種熱處理。用酸除鹽和石灰處理除去雜質(zhì),例如非膠原的蛋白質(zhì)。骨骼必須脫脂??稍谶^程中加入其它洗滌和過濾步驟,離子交換和其它化學(xué)和消毒處理,來進(jìn)一步純化材料。另外,在加工后仍可能存在污染物和雜質(zhì),得到的明膠產(chǎn)物因此必須澄清,純化,常常在準(zhǔn)備使用前需要進(jìn)一步濃縮。商品明膠常常分為A型和B型。這些分類反映了作為提取過程一部分所接收的預(yù)處理提取來源。A型通常衍生自酸加工的材料,通常是豬皮,B型通常衍生自堿或石灰加工的材料,通常是牛骨(骨膠原)和皮革。在A和B兩型提取過程中,得到的明膠產(chǎn)物通常是明膠分子的混合物,大小從幾千到幾十萬道爾頓不等。分為凝膠化或非凝膠化型,和通常作為A型明膠加工的魚明膠也用于一些商業(yè)應(yīng)用。凝膠化型通常衍生自一些溫水魚的皮膚,而非凝膠化型通常衍生自冷水魚。魚明膠具有廣泛變化的氨基酸組分,與動物明膠不同,脯氨酸和羥脯氨酸殘基比例通常較低。與其它動物明膠相反,魚明膠通常在低得多的溫度下,甚至在平均分子量相當(dāng)時仍保持液態(tài)。與動物明膠一樣,魚明膠是從魚皮中經(jīng)過處理然后水解提取的。另外,與動物提取過程相同,提取魚明膠的過程得到不均勻的產(chǎn)物。目前的提取方法得到的是蛋白質(zhì)異源混合物,含有分子量范圍不同的多肽的明膠。有時必須混合各種產(chǎn)物批料,來獲得含有適用于所需用途的具有物理性能的明膠混合物。因此需要可靠和可重現(xiàn)的明膠生產(chǎn)方法,提供特征受控制的均一產(chǎn)物。另外,在藥物、化妝品、食品和飲料工業(yè)中,尤其需要從例如牛、豬骨骼和組織的動物來源提取獲得的明膠以外的明膠來源。另外,由于目前可得的明膠是從動物來源如骨骼和組織生產(chǎn)的,有擔(dān)心含明膠產(chǎn)品的不良免疫原性和感染性(見例如Sakaguchi,M.等(1999)J.Aller.clin.Immunol.104695-699;Miyazawa等(1999)Vaccine172176-2180;Sakaguchi等(1999)Immunology96286-290;Kelso(1999)JAller.Clin.Immunol.103200-202;Asher(1999)DevBiolStand9941-44;和Verdrager(1999)Lancet3541304-1305)。另外,可得到不經(jīng)過動物來源,如組織和骨骼提取的基礎(chǔ)物質(zhì)將克服各種倫理、宗教和社會要求。不需要從動物來源,例如組織和骨骼提取的重組物質(zhì)可用于例如制造食品和其它食用產(chǎn)品,包括膠囊化的藥物,適用于具有飲食限制的人,例如信奉猶太教和伊斯蘭教的人。翻譯后酶翻譯后酶對膠原和膠原蛋白生物合成是重要的。例如,脯氨酰4-羥化酶是將重復(fù)的-Gly-X-Y-序列中Y位置的脯氨酰殘基羥化成4-羥脯氨酸必需的(見例如Prockop等(1984)N.Engl.J.Med.311376-386)。羥脯氨酸起到了穩(wěn)定膠原三股螺旋的關(guān)鍵作用。脊椎動物脯氨酰4-羥化酶是α2β2四聚體(見例如Berg和Prockop(1973)J.Biol.Chem.2481175-1192;和Tuderman等(1975)Eur.J.Biochem.529-16)。α亞基(63kDa)含有羥化脯氨酰殘基的催化位點(diǎn),在缺乏β亞基的情況下是不溶的。與蛋白質(zhì)二硫鍵異構(gòu)酶相同的β亞基(55kDa)催化蛋白質(zhì)底物的硫醇-二硫鍵互換,導(dǎo)致形成對建立穩(wěn)定蛋白必需的二硫鍵。當(dāng)作為脯氨酰4-羥化酶四聚體的一部分時,β亞基保留50%蛋白質(zhì)二硫異構(gòu)酶活性(見例如Pihlajaniemi等(1987)EmboJ.6643-649;Parkkonen等(1988)Biochem.J.2561005-1011;和Koivu等(1987)J.Biol.Chem.2626447-6449)。在昆蟲細(xì)胞中通過刺激性表達(dá)α和β亞基產(chǎn)生了活性重組人脯氨酰4-羥化酶(見例如Vuori等(1992)Proc.Natl.Acad.Sci.USA897467-7470)。除了脯氨酰4-羥化酶,在文獻(xiàn)中已鑒定和報道了其它膠原翻譯后酶,包括例如C-蛋白酶,N-蛋白酶,賴氨酰氧化酶和賴氨酰羥化酶(見例如Olsen等(1991)CellBiologyofExtracellularMatrix,第二版,Hay編,PlenumPress,NewYork)。在各種重組宿主-載體系統(tǒng)中不難獲得許多外源基因的表達(dá)。然而如果蛋白質(zhì)的最終形成需要廣泛的翻譯后加工,表達(dá)就變得困難。例如,脯氨酰4-羥化酶活性是膠原結(jié)構(gòu)域羥化所必需的要求。在脯氨酰4-羥化酶內(nèi)源活性缺陷的表達(dá)系統(tǒng)中必需補(bǔ)充脯氨酰4-羥化酶,來提供天然存在的羥化系統(tǒng)。難以獲得可靠和穩(wěn)定的膠原基因的重組表達(dá)阻礙了有許多有用用途的膠原和明膠的生產(chǎn)。另外,許多類型的膠原在組織中僅以痕量存在,不能從這些來源大量獲得。另外,可在提取和純化過程后留下或在其中引入非膠原性雜質(zhì)??偨Y(jié)總的說,雖然商品可得的動物膠原和明膠特性適用于許多產(chǎn)品,但這些現(xiàn)在可得的材料的可變性,和與優(yōu)化這些材料以用于各種用途的相關(guān)的困難,提供了極小的變通性。結(jié)果,本領(lǐng)域需要一種有效的系統(tǒng),能夠在基因和分子水平修飾起始材料,提供產(chǎn)生為了不同用途和市場特別定制和標(biāo)準(zhǔn)化的重組膠原和明膠的可能性。另外,對于使用目前可得的提取材料有關(guān)的免疫原性和感染性的危險的關(guān)注也需要純凈和安全的取代材料。發(fā)明簡述本發(fā)明提供了動物膠原和明膠,以及制備這些動物膠原和明膠的方法。因此,在一個方面,本發(fā)明包含一種分離和純化的多肽,該多肽是選自α1(I)膠原、α2(I)膠原和α1(III)膠原和這些膠原的片段和變體的?;蜇i多肽。在一個實(shí)施例中,本發(fā)明提供了一種分離和純化的多肽,它是牛α1(I)膠原或其片段或變體。在一些實(shí)施例中,多肽是單鏈或同三聚或異三聚的。在一個方面,多肽含有SEQIDNO2的氨基酸序列或其片段或變體。還提供了含有該多肽的組合物。在另一個實(shí)施例中,本發(fā)明包含一種分離和純化的多核苷酸,編碼牛α1(I)膠原或其片段或變體,和分離和純化的多核苷酸,它與編碼牛α1(I)膠原或其片段或變體的多核苷酸互補(bǔ)。本發(fā)明在一個實(shí)施例中提供了一條編碼SEQIDNO2的分離和純化的多核苷酸或其片段或變體。還提供了含有該多核苷酸的組合物、表達(dá)載體和宿主細(xì)胞。在各種實(shí)施例中,宿主細(xì)胞是原核細(xì)胞或真核細(xì)胞,特別是動物、酵母、植物、昆蟲或真菌細(xì)胞。在某些實(shí)施例中,本發(fā)明提供了含有該多核苷酸的轉(zhuǎn)基因動物和轉(zhuǎn)基因植物。在一個方面,本發(fā)明包括產(chǎn)生牛α1(I)膠原的方法,該方法包括在適合表達(dá)牛α1(I)膠原的條件下培養(yǎng)含有多核苷酸的宿主細(xì)胞,從宿主細(xì)胞培養(yǎng)物回收牛α1(I)膠原。在一些實(shí)施例中,本發(fā)明提供含有牛α1(I)膠原或其片段或變體的重組膠原和重組明膠。本發(fā)明特別提供了重組膠原和明膠,含有SEQIDNO2或其片段或變體。在一個實(shí)施例中本發(fā)明提供了一種分離和純化的多肽,含有牛α1(III)膠原或其片段或變體。在一些實(shí)施例中,多肽是單鏈或同三聚或異三聚的。在一個方面,多肽含有SEQIDNO4或SEQIDNO6的氨基酸序列或其片段或變體。還提供了含有該多肽的組合物。在另一個實(shí)施例中,本發(fā)明包含了一種分離和純化的編碼牛α1(III)膠原或其片段或變體的多核苷酸和分離和純化的,與編碼牛α1(III)膠原或其片段和變體的多核苷酸互補(bǔ)的多核苷酸。本發(fā)明在一個實(shí)施例中提供了一種分離和純化的編碼SEQIDNO4或SEQIDNO6的多核苷酸或其片段或變體。還提供了含有該多核苷酸的組合物、表達(dá)載體和宿主細(xì)胞。在許多實(shí)施例中,宿主細(xì)胞是原核細(xì)胞或真核細(xì)胞,特別是動物、酵母、植物、昆蟲或真菌細(xì)胞。在某些實(shí)施例中,本發(fā)明提供了含有該多核苷酸的轉(zhuǎn)基因動物和轉(zhuǎn)基因植物。在一個方面,本發(fā)明包括產(chǎn)生牛α1(III)膠原的方法,該方法包括在適合表達(dá)牛α1(III)膠原的條件下培養(yǎng)含有多核苷酸的宿主細(xì)胞,從宿主細(xì)胞培養(yǎng)物回收牛α1(III)膠原。在一些實(shí)施例中,本發(fā)明提供含有牛α1(III)膠原或其片段或變體的重組膠原和重組明膠。本發(fā)明特別提供了含有SEQIDNO4或SEQIDNO6的重組膠原和明膠,或其片段或變體。在一個實(shí)施例中,本發(fā)明提供了一種分離和純化的多肽,它是豬α1(I)膠原或其片段或變體。在一些實(shí)施例中,多肽是單鏈或同三聚或異三聚的。在一個方面,多肽含有SEQIDNO8的氨基酸序列或其片段或變體。還提供了含有該多肽的組合物。在另一個實(shí)施例中,本發(fā)明包含一種分離和純化的多核苷酸,編碼豬α1(I)膠原或其片段或變體,和分離和純化的多核苷酸,它與編碼豬α1(I)膠原或其片段或變體的多核苷酸互補(bǔ)。本發(fā)明在一個實(shí)施例中提供了一條編碼SEQIDNO8的分離和純化的多核苷酸或其片段或變體。還提供了含有該多核苷酸的組合物、表達(dá)載體和宿主細(xì)胞。在各種實(shí)施例中,宿主細(xì)胞是原核細(xì)胞或真核細(xì)胞,特別是動物、酵母、植物、昆蟲或真菌細(xì)胞。在某些實(shí)施例中,本發(fā)明提供了含有該多核苷酸的轉(zhuǎn)基因動物和轉(zhuǎn)基因植物。在一個方面,本發(fā)明包括產(chǎn)生豬α1(I)膠原的方法,該方法包括在適合表達(dá)豬α1(I)膠原的條件下培養(yǎng)含有多核苷酸的宿主細(xì)胞,從宿主細(xì)胞培養(yǎng)物回收豬α1(I)膠原。在一些實(shí)施例中,本發(fā)明提供含有豬α1(I)膠原或其片段或變體的重組膠原和重組明膠。本發(fā)明特別提供了含有SEQIDNO8的重組膠原和明膠,或其片段或變體。在一個實(shí)施例中,本發(fā)明提供了一種分離和純化的多肽,它是豬α2(I)膠原或其片段或變體。在一些實(shí)施例中,多肽是單鏈或同三聚或異三聚的。在一個方面,多肽含有SEQIDNO10的氨基酸序列或其片段或變體。還提供了含有該多肽的組合物。在另一個實(shí)施例中,本發(fā)明包含一種分離和純化的多核苷酸,編碼豬α2(I)膠原或其片段或變體,和分離和純化的多核苷酸,它與編碼豬α2(I)膠原或其片段或變體的多核苷酸互補(bǔ)。本發(fā)明在一個實(shí)施例中提供了一條編碼SEQIDNO10的分離和純化的多核苷酸或其片段或變體。還提供了含有該多核苷酸的組合物、表達(dá)載體和宿主細(xì)胞。在各種實(shí)施例中,宿主細(xì)胞是原核細(xì)胞或真核細(xì)胞,特別是動物、酵母、植物、昆蟲或真菌細(xì)胞。在某些實(shí)施例中,本發(fā)明提供了含有該多核苷酸的轉(zhuǎn)基因動物和轉(zhuǎn)基因植物。在一個方面,本發(fā)明包括產(chǎn)生豬α2(I)膠原的方法,該方法包括在適合表達(dá)豬α2(I)膠原的條件下培養(yǎng)含有多核苷酸的宿主細(xì)胞,從宿主細(xì)胞培養(yǎng)物回收豬α2(I)膠原。在一些實(shí)施例中,本發(fā)明提供含有豬α2(I)膠原或其片段或變體的重組膠原和重組明膠。本發(fā)明特別提供了重組膠原和明膠,含有SEQIDNO10或其片段或變體。在一個實(shí)施例中,本發(fā)明提供了一種分離和純化的多肽,它是豬α1(III)膠原或其片段或變體。在一些實(shí)施例中,多肽是單鏈或同三聚或異三聚的。在一個方面,多肽含有SEQIDNO12的氨基酸序列或其片段或變體。還提供了含有該多肽的組合物。在另一個實(shí)施例中,本發(fā)明包含一種分離和純化的多核苷酸,編碼豬α1(III)膠原或其片段或變體,和分離和純化的多核苷酸,它與編碼豬α1(III)膠原或其片段或變體的多核苷酸互補(bǔ)。本發(fā)明在一個實(shí)施例中提供了一條編碼SEQIDNO12的分離和純化的多核苷酸或其片段或變體。還提供了含有該多核苷酸的組合物、表達(dá)載體和宿主細(xì)胞。在各種實(shí)施例中,宿主細(xì)胞是原核細(xì)胞或真核細(xì)胞,特別是動物、酵母、植物、昆蟲或真菌細(xì)胞。在某些實(shí)施例中,本發(fā)明提供了含有該多核苷酸的轉(zhuǎn)基因動物和轉(zhuǎn)基因植物。在一個方面,本發(fā)明包括產(chǎn)生豬α1(III)膠原的方法,該方法包括在適合表達(dá)豬α1(III)膠原的條件下培養(yǎng)含有多核苷酸的宿主細(xì)胞,從宿主細(xì)胞培養(yǎng)物回收豬α1(III)膠原。在一些實(shí)施例中,本發(fā)明提供含有豬α1(III)膠原或其片段或變體的重組膠原和重組明膠。本發(fā)明特別提供了重組膠原和明膠,含有SEQIDNO12或其片段或變體。還提供了產(chǎn)生重組動物膠原和明膠的方法。在一個實(shí)施例中本發(fā)明提供了一種產(chǎn)生重組動物膠原的方法,該方法包括在一個宿主細(xì)胞中引入至少一個含有編碼動物膠原或前膠原的多核苷酸序列的表達(dá)載體和至少一個在允許表達(dá)多核苷酸條件下,含有編碼翻譯后酶的多核苷酸的表達(dá)載體;和分離動物膠原。在另一個方面,翻譯后酶選自脯氨酰羥化酶、肽基脯氨酰異構(gòu)酶、膠原半乳糖苷羥賴氨酰葡糖轉(zhuǎn)移酶、羥賴氨酰半乳糖苷轉(zhuǎn)移酶、C-蛋白酶、N-蛋白酶、賴氨酰羥化酶和賴氨酰氧化酶。在一個實(shí)施例中,翻譯后酶選自與動物膠原相同的物種。在另一個實(shí)施例中,宿主細(xì)胞選自與動物膠原相同的物種。在還有實(shí)施例中,宿主細(xì)胞不內(nèi)源性產(chǎn)生膠原,或不內(nèi)源性產(chǎn)生翻譯后酶。特別提供了一種含有至少一個編碼動物膠原的表達(dá)載體和至少一個編碼翻譯后酶的表達(dá)載體的宿主細(xì)胞。在一個方面,本發(fā)明提供了一種基本不含任何其它類型膠原的一型重組動物膠原。在這一種類型的膠原是特別選自I型、II型、III型、IV型、V型、VI型、VII型、VIII型、IX型、X型、XI型、XII型、XIII型、XIV型、XV型、XVI型、XVII型、XVIII型、XIX型、和XX型膠原的實(shí)施例是經(jīng)特別考慮的。還提供了產(chǎn)生重組動物明膠的方法。在一個方面,該方法包括提供重組動物膠原,和衍生重組動物明膠。在另一個方面,該方法包括直接從改變的動物膠原結(jié)構(gòu)產(chǎn)生重組動物明膠。附圖簡述圖1A、1B和1C顯示編碼牛α1(I)膠原的核酸序列(SEQNO1)。圖2A、2B、2C和2D顯示牛α1(I)膠原的氨基酸序列(SEQNO2)。圖3A、3B和3C顯示編碼牛α1(III)膠原的核酸序列(SEQNO3)。圖4A、4B、4C和4D顯示牛α1(III)膠原的氨基酸序列(SEQNO4)。圖5A、5B和5C顯示編碼牛α1(III)膠原的核酸序列(SEQNO5)。圖6A、6B、6C和6D顯示牛α1(III)膠原的氨基酸序列(SEQNO6)。圖7A、7B和7C顯示編碼豬α1(I)膠原的核酸序列(SEQNO7)。圖8A、8B、8C和8D顯示豬α1(I)膠原的氨基酸序列(SEQNO8)。圖9A、9B和9C顯示編碼豬α2(I)膠原的核酸序列(SEQNO9)。圖10A、10B、10C和10D顯示豬α2(I)膠原的氨基酸序列(SEQNO10)。圖11A、11B和11C顯示編碼豬α1(III)膠原的核酸序列(SEQNO11)。圖12A、12B、12C和12D顯示豬α1(III)膠原的氨基酸序列(SEQNO12)。圖13A、13B、13C、13D、13E、13F、13G、13H和13I描述了翻譯的牛α1(I)膠原開放閱讀框序列與已知的人(HU)、小鼠(MUS)、犬(CANIS)、牛蛙(RANA)和日本水螈(CYNPS)膠原序列的排列。發(fā)明詳述在描述本發(fā)明的蛋白質(zhì)、核苷酸序列和方法之前,應(yīng)理解本發(fā)明不限于所述的具體方法、方案、細(xì)胞系、載體和試劑,因?yàn)檫@些可變。還應(yīng)理解本文所用的術(shù)語僅為描述特定實(shí)施例,而不是為了限制本發(fā)明的范圍。必須注意本文和在權(quán)利要求中所用的單個“一”、“一個”和“該”包括復(fù)數(shù),除非上下文明確說明。因此例如“一個宿主細(xì)胞”指一個或多個這樣的宿主細(xì)胞及其本領(lǐng)域技術(shù)人員已知的等價物,“一種抗體”指一種或多種抗體及其本領(lǐng)域技術(shù)人員已知的等價物。除非另外說明,本文所用的所有技術(shù)和科學(xué)術(shù)語具有本發(fā)明所屬領(lǐng)域的技術(shù)人員通常理解的意義。雖然在實(shí)踐和測試本發(fā)明中可使用任何與本文所屬的相似或相同的方法和材料,在此描述優(yōu)選的方法、裝置和材料。所有本文提到的出版物在此引入以供參考,用于描述和公開細(xì)胞系、載體和方法等,它們在可與本發(fā)明結(jié)合使用的出版物中有所報道。本文中的任何陳述都不被認(rèn)為是承認(rèn)本發(fā)明無權(quán)根據(jù)先前的發(fā)明提前公開。本文引用的所有文獻(xiàn)在此完整引入以供參考。本發(fā)明的實(shí)施將使用(除非另外說明)本領(lǐng)域技術(shù)范圍內(nèi)的化學(xué)、生物化學(xué)、分子生物學(xué)、免疫學(xué)和藥物學(xué)的方法。這些技術(shù)在文獻(xiàn)中有完整解釋。見例如Gennaro,A.R.編(1990)Remington’sPharmaceuticalScience,第18版,MackPublishingCo.;Colowick,S.等編,MethodsinEnzymology,AcademicPress,Inc.;HandbookofExperimentalImmunology,Vols.I-IV(D.M.Weir和C.C.Blackwell編,1986,BlackwellScientificPublications);Maniatis,T.等編(1989)MolecularCloningALaboratoryManual第二版,I-III卷,ColdSpringHarborLaboratoryPress;Ausubel,F(xiàn).M.等編(1999)ShortProtocolsinMolecularBiology,第四版,JohnWiley&Sons;Ream等編(1998)MolecularBiologyTechniquesAnIntensiveLaboratoryCourse,AcademicPress);PCR(IntroductiontoBiotechniquesSeries),第二版(Newton&Graham編,1997,SpringerVerlag)。定義術(shù)語“膠原”指任一已知膠原類型,包括膠原I-XX型,和任何其它膠原,不論天然、合成、半合成或重組的。該術(shù)語也包括前膠原。術(shù)語膠原包含任何一條多核苷酸編碼的單鏈多肽,和膠原鏈的同三聚和異三聚裝配。術(shù)語“膠原”特別包括其變體和片段,及其功能性等價物和衍生物,它們優(yōu)選保留至少一種膠原的結(jié)構(gòu)或功能特征,例如(Gly-X-Y)n結(jié)構(gòu)域。因此例如術(shù)語“牛α1(I)膠原”指一條多核苷酸序列編碼的單鏈牛α1(I)膠原,和任何相應(yīng)的前膠原,或其任何片段、變體、功能性等價物或衍生物。術(shù)語“牛I型膠原”指含有牛I型膠原鏈的同三聚或異三聚膠原,和任何相應(yīng)的前膠原,或任何其片段、變體、功能性等價物或衍生物。術(shù)語“前膠原”指對應(yīng)膠原I-XX型任何一種的前膠原,以及對應(yīng)任何其它膠原,不論是合成、半合成或重組的前膠原,它們具有額外的C-末端和/或N-末端前肽或端肽,輔助三聚體裝配、溶解性、純化或任何其它功能,然后由與膠原產(chǎn)生有關(guān)的N-蛋白酶、C-蛋白酶或其它酶(例如蛋白酶)切割。術(shù)語前膠原特別包含其變體和片段,及其功能性等價物和衍生物,其優(yōu)選保留膠原的至少一個結(jié)構(gòu)或功能特征,例如(Gly-X-Y)n結(jié)構(gòu)域。術(shù)語“牛α1(I)”指來自任何天然、合成、半合成或重組的來源的牛α1(I)膠原或其功能性等價物,及其片段和變體,和編碼該多肽的多核苷酸。術(shù)語“牛α1(III)”指來自任何天然、合成、半合成或重組的來源的牛α1(III)膠原或其功能性等價物,及其片段和變體,和編碼該多肽的多核苷酸。術(shù)語“豬α1(I)”指來自任何天然、合成、半合成或重組的來源的豬α1(I)膠原或其功能性等價物,及其片段和變體,和編碼該多肽的多核苷酸。術(shù)語“豬α2(I)”指來自任何天然、合成、半合成或重組的來源的豬α2(I)膠原或其功能性等價物,及其片段和變體,和編碼該多肽的多核苷酸。術(shù)語“豬α1(III)”指來自任何天然、合成、半合成或重組的來源的豬α1(III)膠原或其功能性等價物,及其片段和變體,和編碼該多肽的多核苷酸。本文所用的“明膠”指任何明膠,不論是用傳統(tǒng)方法提取或重組或原始生物合成的,或任何具有明膠的至少一種結(jié)構(gòu)和/或功能特征的分子。明膠目前是通過提取衍生自動物(例如牛、豬、嚙齒類、雞、馬、魚)來源,如骨骼和組織的膠原獲得的。術(shù)語明膠同時包括包含在明膠產(chǎn)物中的一種以上多肽的組合,和形成明膠物質(zhì)的單獨(dú)的多肽。因此,本發(fā)明所使用的重組明膠同時包括構(gòu)成本發(fā)明明膠多肽的重組明膠物質(zhì),和本發(fā)明的單獨(dú)的明膠多肽??裳苌髂z的多肽是膠原、前膠原和其它具有膠原的至少一種結(jié)構(gòu)和/或功能特征的多肽。該多肽可以含有一條膠原鏈或膠原同三聚體或異三聚體或其任何片段、衍生物、寡聚體、聚合物或其亞基,含有至少一種膠原結(jié)構(gòu)域(Gly-X-Y區(qū))。該術(shù)語特別指天然情況下不存在的工程改造過的序列,例如改變的膠原構(gòu)建體等。改變的膠原構(gòu)建體是含有通過缺失、添加、取代或其它改變從天然存在的膠原基因改變的序列的多核苷酸?!白魟笔侨魏渭拥剿幬锘蛞呙缰刑岣?、增強(qiáng)或輔助其作用的制劑。在疫苗制劑中使用的佐劑可以是免疫劑,它能通過產(chǎn)生免疫應(yīng)答非特異性刺激因子來增強(qiáng)免疫應(yīng)答。佐劑常用于非活疫苗。術(shù)語“等位基因”或“等位基因序列”指基因序列的改變形式。等位基因可由核酸序列中的至少一個突變得到,等位基因可導(dǎo)致改變的mRNA或多肽,其結(jié)構(gòu)或功能可以改變也可以不改變。任何給定的天然或重組基因可以不具有,具有一種或多種等位基因形式。產(chǎn)生等位基因的通常突變改變常常歸因于天然缺失、添加或核苷酸的取代。這些改變類型中每一種都可以單獨(dú)或與其它改變聯(lián)合發(fā)生,在給定序列中發(fā)生一次或多次?!案淖兊摹倍嗪塑账嵝蛄邪ň哂胁煌暮塑账崛笔А⒉迦牖蛉〈?,得到編碼相同或功能上等價的多肽的多核苷酸的多核苷酸序列。該定義中包括顯示多態(tài)性的序列,它可用或不可用特定的寡核苷酸探針,或通過除去與等位基因的不正確或未預(yù)計的雜交來檢測,具有除了對該測定的多核苷酸序列正常染色體座位以外的(基因)座。“改變的”多肽可以含有氨基酸殘基的缺失、插入或取代,它產(chǎn)生沉默改變并導(dǎo)致功能上等價的多肽??稍跇O性、電荷、溶解度、疏水性、親水性和/或殘基的兩親性性質(zhì)相似基礎(chǔ)上制造精確的氨基酸取代,只要保留編碼的多肽的生物學(xué)或免疫學(xué)活性。例如,帶負(fù)電的氨基酸可包括天冬氨酸和谷氨酸;帶正電的氨基酸可包括賴氨酸和精氨酸;具有不帶電的極性頭部基團(tuán),具有相似的親水性的氨基酸可包括亮氨酸、異亮氨酸和纈氨酸、甘氨酸和丙氨酸、天冬酰胺和谷氨酰胺、絲氨酸和蘇氨酸和苯丙氨酸和酪氨酸。本文所用的這些術(shù)語“氨基酸”或“多肽”序列或“多肽”指寡肽、肽、多肽或蛋白質(zhì)序列及其片段,和天然存在或合成的分子。多肽或氨基酸片段是保留該多肽的至少一種結(jié)構(gòu)和/或功能特征的多肽任何部分。在本發(fā)明的至少一個實(shí)施例中,多肽片段是保留至少一個(Gly-X-Y)n區(qū)的片段。本文所用的術(shù)語“動物”例如在“動物膠原”中包含任何膠原,例如天然,合成,半合成或重組的。動物來源包括例如哺乳動物來源,包括但不限于牛、豬、馬、嚙齒類和羊來源以及其它動物來源,包括但不限于雞和魚來源和非脊椎動物來源?!翱乖浴鄙婕爱?dāng)引入體內(nèi)時,一種物質(zhì)能夠刺激免疫應(yīng)答并產(chǎn)生抗體的能力。顯示抗原性的因子稱為抗原性的。抗原性因子可包括但不限于各種大分子,例如蛋白質(zhì)、脂蛋白、多糖、核酸、細(xì)菌和細(xì)菌組分、以及病毒和病毒組分。本文所用的術(shù)語“互補(bǔ)”或“互補(bǔ)性”指多核苷酸通過堿基配對的天然結(jié)合。例如序列“A-G-T”與互補(bǔ)序列“T-C-A”結(jié)合。兩條單鏈分子之間的互補(bǔ)性可以是“部分的”,即當(dāng)該核酸中的僅某些可以結(jié)合,或完整的,當(dāng)單鏈分子之間存在完全互補(bǔ)。核酸鏈之間的互補(bǔ)程度對核酸鏈雜交的效力和強(qiáng)度有顯著影響。這對依賴于核酸鏈之間的結(jié)合的擴(kuò)增反應(yīng)特別重要,例如在設(shè)計和使用肽核酸(PNA)分子中?!叭笔А笔前被峄蚝塑账嵝蛄兄袑?dǎo)致缺少一個或多個氨基酸殘基或核苷酸的改變。用于多核苷酸的術(shù)語“衍生的”指化學(xué)修飾編碼特定多肽的多核苷酸或與編碼特定多肽的多核苷酸互補(bǔ)的多核苷酸。這種修飾包括例如用烷基、?;虬被脫Q氫。本文用于多肽的術(shù)語“衍生的”指通過羥化、糖基化、聚乙二醇化或任何相似方法修飾的多肽。術(shù)語“衍生物”包含含有衍生出它的分子的至少一種結(jié)構(gòu)和/或功能特征的分子。當(dāng)一個分子含有在正常情況下不是該分子一部分的額外化學(xué)基團(tuán)時,它被稱為其它分子的“化學(xué)衍生物”。這些基團(tuán)可改善分子的溶解性、吸收性、生物半衰期等。該基團(tuán)還可以降低分子的毒性,消除或弱化分子的任何不良副作用等。能介導(dǎo)這些效果的基團(tuán)是本領(lǐng)域一般可得的,并可在例如Remington’sPharmaceuticalSciences,見上文中找到。將這些基團(tuán)與分子偶聯(lián)的方法是本領(lǐng)域熟知的。作為術(shù)語用于本文的“賦形劑”是任何在藥物、疫苗或其它藥物組合物配制中用作稀釋劑或載體的惰性物質(zhì),來賦予該藥物、疫苗或藥物組合物合適的稠度形態(tài)。本文所用的術(shù)語“功能性等價物”指具有特定多肽或多核苷酸的至少一種功能和/或結(jié)構(gòu)特征的多肽或多核苷酸。功能性等價物可含有能進(jìn)行特定功能的修飾。術(shù)語“功能性等價物”將包括分子的片段、突變體、雜交物、變體、同類物或化學(xué)衍生物?!叭诤系鞍住笔瞧渲须男蛄衼碜圆煌鞍踪|(zhì)并可操縱性連接的蛋白質(zhì)。術(shù)語“雜交”指核酸序列與互補(bǔ)序列通過堿基配對結(jié)合的過程。雜交條件可用例如預(yù)雜交和雜交溶液中鹽或甲酰胺濃度,或雜交溫度限定,是本領(lǐng)域熟知的。雜交可在各種嚴(yán)格條件下發(fā)生。特別是,嚴(yán)格度可通過降低鹽濃度,提高甲酰胺濃度,或提高雜交溫度來提高。例如,為了本發(fā)明的目的,高嚴(yán)格條件下的雜交發(fā)生在約37℃-42℃下,約50%甲酰胺中,降低的嚴(yán)格條件下,在約35%-25%甲酰胺中,約30-35℃下。特別是,雜交在,42℃,50%甲酰胺,5XSSPE,0.3%SDS和200微克/毫升剪切和變性的鮭魚精DNA最高的嚴(yán)格條件下發(fā)生。對應(yīng)具體嚴(yán)格水平的溫度范圍可用本領(lǐng)域已知的方法進(jìn)一步縮小,例如,通過計算感興趣的核酸的嘌呤和嘧啶比,據(jù)此調(diào)節(jié)溫度。為了除去非專一信號,可依次洗滌印跡,例如在遞增的嚴(yán)格條件下,達(dá)0.1XSSC和0.5%SDS在室溫下洗滌。上述范圍和條件的變化是本領(lǐng)域熟知的?!懊庖咴浴鄙婕霸谏矬w內(nèi)引起免疫應(yīng)答的能力。顯示免疫原性性質(zhì)的因子稱為免疫原性的。因子可包括但不限于各種大分子,例如蛋白質(zhì)、脂蛋白、多糖、核酸、細(xì)菌和細(xì)菌組分,以及病毒和病毒組分。免疫原性因子通常具有相當(dāng)高的分子量(通常大于10kDa)?!案腥拘浴敝改芨腥净蚰墚a(chǎn)生感染,指微生物,例如細(xì)菌或病毒在體內(nèi)的侵襲和復(fù)制。術(shù)語“插入”或“添加”指多肽或多核苷酸序列中的改變,分別導(dǎo)致與天然存在的分子相比加入一個或多個氨基酸或核苷酸。本文所用的術(shù)語“分離的”指不僅從存在于來自蛋白質(zhì)天然來源的蛋白質(zhì),還從一般其它成分中分離得到的分子,優(yōu)選指在如果存在僅一種溶劑、緩沖劑、離子的任何東西或其它通常存在于該相同溶液中的組分中發(fā)現(xiàn)的分子。本文所用的術(shù)語“分離的”和“純化的”不包括其天然來源中存在的分子。術(shù)語“微陣列”指任何核酸、氨基酸、抗體等在基質(zhì)上的排列。基質(zhì)可以是任何合適的載體,例如珠、玻璃、紙、硝基纖維素、尼龍、或任何合適的膜等。基質(zhì)可以是任何剛性或半剛性的載體,包括但不限于膜、濾膜、晶片、芯片、玻片、纖維、珠,包括磁性或非磁性的珠、凝膠、管材、皿、聚合物、微粒、毛細(xì)管等。基質(zhì)可提供包被的表面和/或具有各種表面形式,例如小孔(wells)、針(pins)、溝(trenches)、渠(channels)和細(xì)孔(pore),在其上可結(jié)合核酸和氨基酸等。術(shù)語“微生物”可包括但不限于病毒、細(xì)菌、衣原體、立克次氏體、支原體、脲原體、真菌和寄生蟲,包括感染性寄生蟲例如原生動物。術(shù)語“核酸”或“多核苷酸”序列或“多核苷酸”指寡核苷酸、核苷酸或多核苷酸或其任何片段,天然或合成來源的DNA或RNA,它們可以是單鏈或雙鏈,并且可代表正義或反義鏈,肽核酸(PNA)或天然或合成來源的任何DNA樣或RNA樣物質(zhì)。多核苷酸片段是任何保留多核苷酸的至少一種結(jié)構(gòu)或功能特征的多核苷酸序列的部分。在本發(fā)明的一個實(shí)施例中,多核苷酸片段是編碼至少一個(Gly-X-Y)n區(qū)的多核苷酸片段。多核苷酸片段長度可變,例如長度可大于60個核苷酸,至少長100個核苷酸,至少長1000個核苷酸或至少長10,000個核苷酸。詞組“相似性百分?jǐn)?shù)(percentsimilarity)”(%相似性)指在比較兩條或多條多肽或多核苷酸序列中發(fā)現(xiàn)的相似序列性百分?jǐn)?shù)。相似性百分?jǐn)?shù)可通過本領(lǐng)域熟知的方法確定。例如氨基酸序列之間的相似性百分?jǐn)?shù)可以用Clustal法計算(見例如Higgins,D.G.和P.M.Sharp(1988)Gene73237-244)。Clustal算法將序列通過檢測所有配對之間的距離分成簇。配對排列簇,然后排列組。通過將序列A的長度減去序列A中缺口殘基的數(shù)目,減去序列B中缺口殘基的數(shù)目的差,除以序列A和序列B之間的殘基匹配和,乘以100計算兩條氨基酸序列,例如序列A和序列B之間的相似性百分?jǐn)?shù)。兩條氨基酸序列之間低或無同源性的缺口不包括在相似性百分?jǐn)?shù)的計算中??捎帽绢I(lǐng)域已知的其它方法計算相似性百分?jǐn)?shù),通過改變雜交條件,并可用MEGALIGN程序(DNASTARInc.,Madison,Wisconsin)用電腦計算。本文所用的術(shù)語“植物”包括指一種或多種植物,即任何真核自養(yǎng)生物,例如被子植物和裸子植物、單子葉和雙子葉植物等,包括但不限于大豆、棉花、苜蓿、亞麻、番茄、甘蔗、甜菜、向日葵、馬鈴薯、煙草、玉米、小麥、水稻、萵苣、香蕉、木薯、紅花、含油種子、油菜、芥菜、加拿大油菜、大麻、水藻、海草等。術(shù)語“植物”還包括一種或多種植物細(xì)胞。術(shù)語“植物細(xì)胞”包括但不限于植物組織和器官,如種子、懸浮培養(yǎng)物、種胚、分生組織區(qū)、愈傷組織、葉、根、芽、配子體、孢子體、花粉、塊莖、球莖、鱗莖、花、果、球花、小孢子等。術(shù)語“翻譯后酶”指任何催化例如任何膠原或前膠原翻譯后修飾的酶。術(shù)語包括但不限于例如,脯氨酰羥化酶、肽基脯氨酰異構(gòu)酶、膠原半乳糖苷羥賴氨酰葡糖轉(zhuǎn)移酶、羥賴氨酰半乳糖苷轉(zhuǎn)移酶、C-蛋白酶、N-蛋白酶、賴氨酰羥化酶和賴氨酰氧化酶。本文所用的術(shù)語“啟動子”通常指能引發(fā),指導(dǎo)和介導(dǎo)多核苷酸序列轉(zhuǎn)錄的核酸序列的調(diào)控區(qū)。啟動子可以另外含有識別序列,例如上游或下游啟動子元件,它們可以影響轉(zhuǎn)錄速率。術(shù)語“非組成型啟動子”指通過特定組織誘導(dǎo)轉(zhuǎn)錄的啟動子,或可以在環(huán)境或發(fā)育控制下誘導(dǎo)轉(zhuǎn)錄,并包括可阻抑和可誘導(dǎo)的啟動子,例如傾向組織的,組織專一性的和細(xì)胞類型特異性的啟動子。這種啟動子包括但不限于可被低氧或冷壓力誘導(dǎo)的AdH1啟動子,被熱壓力誘導(dǎo)的Hsp70啟動子和可被光誘導(dǎo)的PPDK啟動子?!皟A向組織的”啟動子是在某些組織中優(yōu)先引發(fā)轉(zhuǎn)錄的啟動子?!皟A向組織”的啟動子是僅在某些組織中引發(fā)轉(zhuǎn)錄的啟動子?!凹?xì)胞類型特異性”的啟動子是主要在至少一個器官中的某些細(xì)胞類型中例如血管細(xì)胞中驅(qū)動表達(dá)的啟動子?!翱烧T導(dǎo)”或“可阻抑”啟動子是那些在環(huán)境控制下,例如轉(zhuǎn)染受到例如環(huán)境條件,如厭氧條件,存在光,生物壓力等控制下的啟動子,或?qū)?nèi)部、化學(xué)或生物信號,如甘油醛磷酸脫氫酶、AOX1和AOX2甲醇誘導(dǎo)啟動子或物理損傷有反應(yīng)的啟動子。本文所用的術(shù)語“組成型啟動子”指引發(fā)、指導(dǎo)、介導(dǎo)轉(zhuǎn)錄,并且在大部分環(huán)境條件下和在發(fā)育或細(xì)胞分化的狀態(tài)下具有活性的啟動子。組成型啟動子的例子包括但不限于花椰菜花葉病毒(CaMy)35S,衍生自根瘤土壤桿菌T-DNA的1’-或2’-啟動子、泛蛋白1啟動子、Smas啟動子、肉桂醇脫氫酶啟動子、甘油醛脫氫酶啟動子和氧化氮合酶(Nos)啟動子等。本文所用的術(shù)語“純化”描述了指定的分子存在于基本不存在其它生物大分子,例如多核苷酸、蛋白質(zhì)等的狀態(tài)下。術(shù)語優(yōu)選考慮感興趣的分子存在于溶液或組合物中或至少占80%重量;優(yōu)選至少85%重量;更優(yōu)選至少95%重量;和最優(yōu)選至少99.8%重量??纱嬖谒⒕彌_液和其它小分子,尤其是具有小于1kDa的分子量的分子。本文所用的術(shù)語“基本純化的”指從其天然環(huán)境取出的,分離或分開,并至少60%,優(yōu)選75%,最優(yōu)選90%無其它與之天然結(jié)合成分的核酸或氨基酸序列?!叭〈笔且粋€或多個氨基酸或核苷酸分別被不同的氨基酸或核苷酸分別置換。本文所用的術(shù)語“轉(zhuǎn)染”指向細(xì)胞中引入表達(dá)載體的過程。各種轉(zhuǎn)染技術(shù)是本領(lǐng)域已知的,例如顯微注射、脂轉(zhuǎn)染或用基因槍。本文限定的“轉(zhuǎn)化”描述了外源核酸序列,例如DNA進(jìn)入和改變受體細(xì)胞的過程。轉(zhuǎn)化可以在天然或人工條件下用各種本領(lǐng)域已知的方法發(fā)生。轉(zhuǎn)化可以依賴于任何已知方法,用于在原核或真核宿主細(xì)胞中插入外源核酸序列。基于要轉(zhuǎn)化的宿主細(xì)胞的類型選擇方法,并且可包括但不限于病毒感染、電泳、熱休克、脂轉(zhuǎn)染和粒子轟擊。這種“經(jīng)轉(zhuǎn)染的”細(xì)胞包括穩(wěn)定轉(zhuǎn)化的細(xì)胞,其中插入的DNA能作為自動復(fù)制質(zhì)粒或作為宿主染色體的一部分來復(fù)制,還包括能在一段限定時間內(nèi)瞬時表達(dá)插入的核酸的細(xì)胞。本文所用的術(shù)語“疫苗”指制備殺死的或修飾的微生物、活的減毒生物或活的完全毒性生物或任何其它因子,包括但不限于肽、蛋白質(zhì)、生物大分子或核酸的天然、合成或半合成的制備物,施用該制備物產(chǎn)生或人工提高對特定疾病的免疫力,以防止類似侵入的再次感染。疫苗可以是活的或滅活的微生物或制劑,包括病毒和細(xì)菌,以及亞單位、合成的、半合成或基于重組DNA的病毒和細(xì)菌。疫苗可以是單價(一種菌株/微生物/疾病疫苗),含有一種微生物或因子(例如脊髓灰質(zhì)炎病毒),或一種微生物或因子的多種抗原。疫苗還可以是多價的,例如二價,三價等(混合的疫苗),含有一種以上的微生物或制劑(例如麻疹-腮腺炎-風(fēng)疹(MMR)疫苗)或一種以上微生物或因子的抗原。從活微生物制備活的疫苗。減毒的疫苗是從微生物制備的活疫苗,它經(jīng)過物理改變或在實(shí)驗(yàn)室動物宿主中系列傳代,或感染組織/細(xì)胞培養(yǎng)物,這種處理產(chǎn)生無毒的株或毒性減弱的株,但維持誘導(dǎo)保護(hù)性免疫的能力?;畹臏p毒疫苗的例子包括麻疹、膽腺炎、風(fēng)疹和犬熱病(caninedistemper)、滅活疫苗是指已用化學(xué)或物理處理(諸如甲醋、β丙醇酸內(nèi)酯(beta-propiolactone)、γ線照射)破壞其感染性微生物成份,而不影響病毒外殼(coat)和細(xì)菌外膜蛋白的抗原性和免疫原性的疫苗。滅活或亞單位疫苗的例子包括流感、甲型肝炎、春髓灰質(zhì)炎(IPV)疫苗。亞單位疫苗由來自病毒、細(xì)菌或其它能引起免疫應(yīng)答的制劑的關(guān)鍵大分子組成。這些成分可用許多方法獲得,例如通過從微生物純化,用重組DNA技術(shù)產(chǎn)生等。亞單位疫苗可含有任何感染因子的合成模擬物。亞單位疫苗可包括大分子,例如細(xì)菌蛋白毒素(如破傷風(fēng)、白喉)、病毒蛋白(如從流感病毒得)、從有莢膜的細(xì)菌(如流感嗜血菌和肺炎鏈球菌)得到的多糖和重組DNA技術(shù)產(chǎn)生的病毒樣顆粒(如乙肝表面抗原)等。合成的疫苗是小合成肽構(gòu)成的疫苗、該肽是模擬病原體表面抗原的,是免疫原性的,或可以是在重組DNA技術(shù)幫助下制造的疫苗,包括核酸經(jīng)過修飾的完整病毒。半合成疫苗或偶聯(lián)疫苗(conjugatevaccines)由結(jié)合在蛋白質(zhì)載體分子的微生物的多糖抗原構(gòu)成。DNA疫苗含有編碼抗原的重組DNA載體,在攝取DNA的宿主細(xì)胞中表達(dá)該編碼抗原后,誘導(dǎo)針對該編碼的抗原的體液和細(xì)胞免疫應(yīng)答。對于多種感染性因子已經(jīng)開發(fā)了疫苗。本發(fā)明針對不論涉及的因子,可用于疫苗制劑的重組明膠,因此不限于本文為了說明而作為例子特別描述的疫苗。疫苗包括但不限于牛痘病毒(天花)、脊髓灰質(zhì)炎病毒(Salk和Sabin疫苗)。腮腺炎、麻疹、風(fēng)疹、白喉、破傷風(fēng)、水痘-帶狀皰疹(水痘/帶狀皰疹)、百日咳(百日咳)、卡介苗(BCG,結(jié)核病)、流感嗜血桿菌腦膜炎、狂犬病、霍亂、日本腦炎病毒、傷寒沙門氏菌、志賀氏菌、甲肝、乙肝、腺病毒、黃熱病、口蹄疫、單純皰疹病毒、呼吸道合胞病毒、輪狀病毒、登革熱、西尼羅河熱病毒、土耳其皰疹病毒(馬立克氏病)、流感和炭疽。本文所用的術(shù)語疫苗包括指各種已經(jīng)開發(fā)或?qū)⒁_發(fā)的感染性和自身免疫病,以及癌癥的疫苗,例如針對各種感染性和自身免疫疾病的疫苗,如針對人類免疫缺陷病毒(HIV)、(HCV)、瘧疾的疫苗,和對乳腺、肺、結(jié)腸、直腸、膀胱和卵巢癌的疫苗。多肽或氨基酸“變體”是一種改變來自特定氨基酸序列的一個或多個氨基酸獲得的氨基酸序列。多肽變體可以具有保守改變,其中取代的氨基酸具有與被置換的氨基酸具有類似的結(jié)構(gòu)或化學(xué)性能,例如用異亮氨酸取代亮氨酸。變體還可以具有非保守取代,其中取代的氨基酸可具于與被取代的氨基酸不同的物理性質(zhì),例如用色氨酸置換甘氨酸。類似的小變化還可以包括氨基酸缺失或插入,或同時包括兩者。優(yōu)選氨基酸變體維持特定多肽的某些結(jié)構(gòu)或功能特征。確定取代、插入或缺失哪些氨基酸殘基的指導(dǎo)可用本領(lǐng)域熟知的計算機(jī)程序,例如LASERGENE軟件(DNASTAR,Inc.Madison,WI)找到。多核苷酸變體是一種特定多核苷酸序列的變體,優(yōu)選具有至少約80%、更優(yōu)選至少約90%,最優(yōu)選至少約95%多核苷酸序列與特定的多核苷酸序列相似。本領(lǐng)域技術(shù)人員應(yīng)理解由于基因編碼的簡并性,可產(chǎn)生編碼特定蛋白質(zhì)的多種不同的多核苷酸序列,其中一些與任何已知和天然存在的基因的多核苷酸序列的同源性最小。因此,本發(fā)明考慮可通過根據(jù)可能的密碼子選擇選擇組合制備的每一種可能的多核苷酸序列變體。可根據(jù)標(biāo)準(zhǔn)密碼子三個一組的基因編碼產(chǎn)生這些組合,所有的這些變體都被視為特別公開。發(fā)明本發(fā)明提供了重組動物膠原和明膠的生產(chǎn)。這些動物膠原和明膠提供了超越目前可得的材料的優(yōu)點(diǎn),在于它們是作為良好特征的和純的蛋白質(zhì)來產(chǎn)生的。還提供了制備這些動物膠原和明膠的方法。在某些實(shí)施例中,本發(fā)明提供了衍生自牛I型膠原、牛III型膠原、豬I型膠原和豬III型膠原的動物膠原和明膠。在某些特殊實(shí)施例中,提供了牛α1(I)、牛α1(III)、豬α1(I)、豬α2(I)和豬α1(III)膠原和明膠。本發(fā)明提供了在不產(chǎn)生任何其它膠原類型的在重組細(xì)胞培養(yǎng)系統(tǒng)中合成相對大量的單一類型的動物膠原的生產(chǎn)。例如,本發(fā)明提供了基本無任何其它膠原形式的動物I型膠原。用本發(fā)明的方法,大大促進(jìn)了膠原的純化。本發(fā)明還針對用于本發(fā)明的方法的載體和質(zhì)粒。這些載體和/或質(zhì)粒由編碼所需膠原或其片段或變體的多核苷酸,必需的啟動子、和其它正確表達(dá)這些多肽必需的序列構(gòu)成。優(yōu)選從動物來源獲得編碼膠原的多核苷酸。動物來源包括非人類哺乳動物來源,諸如牛、綿羊和豬來源。在一個實(shí)施例中,本發(fā)明的載體和質(zhì)粒進(jìn)一步包含編碼一種或多種翻譯后酶或其功能性等價物的至少一種多核苷酸。編碼一種或多種翻譯后酶的多核苷酸可以衍生自任何上述物種。在一個優(yōu)選例中,編碼膠原的多核苷酸衍生自與編碼翻譯后酶的多核苷酸相同的物種。在另一個實(shí)施例中,將至少一種編碼翻譯后酶,例如脯氨酰4-羥化酶,C-蛋白酶,N-蛋白酶,賴氨酰氧化酶或賴氨酰羥化酶的多核苷酸插入不天然產(chǎn)生翻譯后酶的細(xì)胞,例如酵母細(xì)胞,或插入天然不產(chǎn)生足量的翻譯后酶的細(xì)胞,例如一些哺乳動物和昆蟲細(xì)胞。在本發(fā)明的一個優(yōu)選例中,翻譯后酶是脯氨酰4-羥化酶,其中編碼脯氨酰4-羥化酶的α亞基的多核苷酸和編碼脯氨酰4-羥化酶的β亞基的多核苷酸被插入細(xì)胞,以產(chǎn)生生物活性的脯氨酰4-羥化酶。本發(fā)明特別考慮了使用任何生物學(xué)或化學(xué)化合物,如需要的話,對于本發(fā)明的重組動物膠原和明膠使用羥化,即例如脯氨酸羥化和/或賴氨酸羥化。這包括例如內(nèi)源性或外源性補(bǔ)充的來自任何物種的脯氨酰4-羥化酶,包括脯氨酰4-羥化酶的各種同工型,和具有所需活性的脯氨酰4-羥化酶的任何變體或片段或亞基,不論是天然的,合成的或半合成的,和脯氨酰3-羥化酶等其它羥化酶(見例如美國專利號5,928,922),在此完整引入以供參考。在一個實(shí)施例中,脯氨酰羥化酶活性是由衍生自編碼重組膠原或明膠的多核苷酸,或編碼可衍生重組明膠的多肽的相同物種的脯氨酰羥化酶賦予的。在另一個實(shí)施例中,脯氨酰4-羥化酶來自動物,編碼的多核苷酸來自相同動物的序列。本發(fā)明提供了產(chǎn)生重組動物膠原和明膠的方法。應(yīng)注意為了說明,雖然該生產(chǎn)方法一般針對膠原的生產(chǎn),該生產(chǎn)方法可用于直接從改變的膠原構(gòu)建物生產(chǎn)明膠,和生產(chǎn)能衍生出明膠的多肽。在一個實(shí)施例中,該方法包括在適合表達(dá)的條件下,在宿主細(xì)胞中引入編碼動物膠原或前膠原,或其片段或變體的表達(dá)載體,和編碼翻譯后酶的第二個表達(dá)載體,并分離膠原。在一個優(yōu)選例中,翻譯后酶是脯氨酰羥化酶(見例如,美國專利號5,593,859,在此完整引入以供參考)。本發(fā)明還提供了包括至少一種動物膠原鏈或亞基,或其片段或變體的動物膠原。在一個優(yōu)選例中,本發(fā)明的膠原組分含有膠原鏈、或其片段或變體,它具有結(jié)構(gòu)氨基酸模式(Gly-X-Y)n,其中X和Y可以是任何氨基酸。優(yōu)選X和/或Y的氨基酸是脯氨酸或羥脯氨酸;甘氨酸(Gly)是在每條鏈的每隔二個殘基位;重復(fù)的Gly-X-Y三個一組的數(shù)目是約10-3000(即n=10-3000)。膠原鏈中的Gly-X-Y單元,或其亞基或片段是相同或不同的。在一個方面,本發(fā)明的膠原組合物沒有完全糖基化或沒有完全羥化。例如,本發(fā)明的膠原可以是去糖基化、未糖基化、部分糖基化和部分羥化的。在本發(fā)明的另一個方面中,膠原組合物由一類膠原組成,基本不含任何其它類型的膠原。在一個實(shí)施例中,本發(fā)明提供了一種基本無任何其它類型,如II-XX型等的膠原的重組I型膠原。本發(fā)明還包含重組多肽,包括從嵌合基因產(chǎn)生的融合產(chǎn)物,例如可為了治療和其它用途制造膠原的相關(guān)表位。另外,本發(fā)明包含任何對膠原或明膠或其組合物或其任何降解產(chǎn)物作出的任何修飾。這些修飾包括例如加工動物膠原或膠原性蛋白和明膠。本發(fā)明還提供了明膠組合物。特別是本發(fā)明提供了衍生自動物膠原的明膠組合物。在許多實(shí)施例中,該明膠組合物衍生自牛、豬或魚膠原。在本發(fā)明的其它方面,組合物含有衍生自基本無任何其它膠原類型的膠原類型的明膠。在本發(fā)明的另一個方面,明膠組合物含有變性的三鏈螺旋,包括至少一種膠原亞基或鏈,或其片段或變體。本發(fā)明還提供了通過表達(dá)膠原或其功能性等價物生產(chǎn)明膠,和從其衍生明膠的方法。本發(fā)明還提供了從改變的動物膠原構(gòu)建體直接表達(dá)重組動物明膠。(見例如目前擁有的同時申請的美國臨時申請__,題為“重組明膠”,2000年11月10日提交,在此完整引入以供參考)。更特別的是,該過程涉及在細(xì)胞中插入一種表達(dá)載體,它含有至少一種編碼動物膠原的多核苷酸,或其片段或變體,和含有至少一種編碼膠原翻譯后酶或其亞基的多核苷酸的表達(dá)載體,回收膠原,從膠原衍生出明膠。在本發(fā)明的某些實(shí)施例中,可直接從分離的膠原或生物質(zhì)或培養(yǎng)液中獲得明膠組合物。從膠原產(chǎn)生明膠組合物的方法、過程和技術(shù)包括利用去污劑、加熱或變性劑使膠原的三鏈螺旋結(jié)構(gòu)變性,另外,這些方法、過程和技術(shù)還包括,但不限于用強(qiáng)堿或強(qiáng)酸處理,在水溶液中熱提取,離子交換層析,交流過濾和加熱干燥,和其它用于膠原產(chǎn)生明膠組合物的本領(lǐng)域已知的方法。相同的方法、過程和技術(shù)可用于生物質(zhì)或培養(yǎng)液,來產(chǎn)生本發(fā)明的明膠組合物。本發(fā)明還涉及各種動物膠原。在一個方面,本發(fā)明提供了牛I型膠原和牛III型膠原。在特定的實(shí)施例中,提供了牛α1(I)膠原和牛α1(III)膠原及其片段和變體。在另一個方面,本發(fā)明提供了豬I型和豬II型膠原。另外,本發(fā)明提供了豬α1(I)膠原、豬α2(I)膠原和豬α1(III)膠原,及其片段和變體。本發(fā)明還提供了編碼牛α1(I)膠原、牛α1(III)膠原、豬α1(I)膠原或豬α1(III)膠原或豬α2(I)膠原或其片段或變體的多核苷酸。本發(fā)明還提供了與編碼的多核苷酸互補(bǔ)的多核苷酸,以及在嚴(yán)格條件下與這些核酸序列雜交的多核苷酸。本發(fā)明還提供了產(chǎn)生重組牛I型膠原、牛III型膠原、豬I型膠原或豬III型膠原或其片段或變體的方法。在本發(fā)明的另一個方面,含有本發(fā)明的多核苷酸的表達(dá)載體可插入宿主細(xì)胞,產(chǎn)生動物膠原或明膠,例如牛I型、牛III型、豬I型和豬III型膠原或明膠。在一個方法中,含有本發(fā)明的多核苷酸的表達(dá)載體是在宿主細(xì)胞中,用含有編碼本發(fā)明的多肽的多核苷酸的表達(dá)載體與含有編碼翻譯后酶的多核苷酸的表達(dá)載體共表達(dá)得到的。在一個實(shí)施例中,翻譯后酶是脯氨酰4-羥化酶,含有α亞基和β亞基。本發(fā)明的重組動物膠原和明膠限制了人與各種污染物的接觸,這些污染物存在于目前用作制造膠原和膠原衍生物質(zhì)如明膠的原料的動物組織中。另外,本發(fā)明的膠原和明膠比目前從原始動物來源獲得的膠原或明膠更具可復(fù)制性。根據(jù)本發(fā)明,編碼多核苷酸序列以及具有可預(yù)測表現(xiàn)的特征明顯的蛋白質(zhì)可用于產(chǎn)生指導(dǎo)該多肽在合適的宿主細(xì)胞中表達(dá)的重組分子。本領(lǐng)域一般描述了編碼膠原的核酸序列。(見例如Fuller和Boedtker(1981)Biochemistry20996-1006;Sandell等(1984)JBiolChem2597826-34;Kohno等(1984)JBiolChem.25913668-13673;French等(1985)gene39311-312;Metsaranta等(1991)JBiolChem26616862-16869;Metsaranta等(1991)BiochemBiophysActa1089241-243;Wood等(1987)Gene61225-230;Glumoff等(1994)BiochemBiophysActa121741-48;Shirai等(1998)MatrixBiology1785-88;Tromp等(1988)BiochemJ.253919-912;Kuivaniemi等(1988)BiochemJ.252633-640;和Ala-Kokko等(1989)BiochemJ.260509-516)。在一個實(shí)施例中,本發(fā)明提供了一種多核苷酸序列,它含有一種分離的和純化的多核苷酸序列,它與存在于SEQIDNO1中的牛α1(I)膠原多核苷酸序列或其片段或變體具有大于70%的相似性,優(yōu)選大于80%的相似性,更優(yōu)選大于90%的相似性。在另一個實(shí)施例中,多核苷酸序列編碼SEQIDNO2的牛α1(I)氨基酸序列或其片段或變體。在另一個實(shí)施例中,本發(fā)明的多核苷酸序列含有分離的和純化的多核苷酸序列,它與存在于SEQIDNO3或SEQIDNO5中的牛α1(III)膠原的多核苷酸序列或其片段或變體具有大于70%的相似性,優(yōu)選大于80%的相似性,更優(yōu)選大于90%的相似性。在一個實(shí)施例中,多核苷酸序列編碼SEQIDNO4或SEQIDNO6的牛α1(III)序列或其片段或變體。在一方面,本發(fā)明提供了分離的和純化的多核苷酸序列,它含有的一條多核苷酸,與存在于SEQIDNO7中的豬α1(I)膠原的多核苷酸序列或其片段或變體具有大于70%的相似性,優(yōu)選大于80%的相似性,更優(yōu)選大于90%的相似性。在一個實(shí)施例中,多核苷酸序列編碼SEQIDNO8的氨基酸序列或其片段或變體。在另一方面中,本發(fā)明考慮了分離的和純化的多核苷酸序列,它含有一條序列,與存在于SEQIDNO9中的豬α2(I)膠原的多核苷酸序列或其片段或變體具有大于70%的相似性,優(yōu)選大于80%的相似性,更優(yōu)選大于90%的相似性。在一個實(shí)施例中,多核苷酸序列編碼SEQIDNO10的豬α2(I)氨基酸序列或其片段或變體。在另一個方面中,本發(fā)明涉及一種分離的和純化的多核苷酸序列,它與存在于SEQIDNO11中的豬α1(III)膠原的多核苷酸序列或其片段或變體具有大于70%的相似性,優(yōu)選大于80%的相似性,更優(yōu)選大于90%的相似性。在另一個實(shí)施例中,多核苷酸序列編碼SEQIDNO12的豬α1(III)序列或其片段或變體。可用各種本領(lǐng)域已知的方法,從據(jù)信具有感興趣的膠原類型,并在可檢測水平表達(dá)該膠原的組織制備的cDNA文庫,獲得未獲得核酸序列的膠原。例如,可從已知表達(dá)新膠原的細(xì)胞系獲得聚腺苷酸化的mRNA構(gòu)建cDNA文庫,或可用先前制成該組織/細(xì)胞類型的cDNA文庫。用合適的核酸探針篩選cDNA文庫,和/或用專一性識別其它膠原的合適的多克隆或單克隆抗體篩選文庫。合適的核酸探針包括編碼來自相同或不同物種的新穎膠原的已知部分的寡核苷酸探針。其它合適的探針包括但不限于編碼相同或相似基因的寡核苷酸、cDNA或其片段和/或同源性基因組DNA或其片段。用所選的探針篩選cDNA文庫或基因組文庫可用本領(lǐng)域已知的標(biāo)準(zhǔn)方法實(shí)現(xiàn)(見例如Maniatis等,見上)。鑒定新膠原的其它方法涉及重組DNA技術(shù)的已知技術(shù),例如通過直接表達(dá)克隆或用聚合酶鏈?zhǔn)椒磻?yīng)(PCR),如,美國專利號4,683,195,或如Maniatis等,見上或Ausubel等,見上所述??筛鶕?jù)本發(fā)明使用的改變的多核苷酸序列包括缺失、添加或取代不同的核苷酸殘基,得到編碼相同或功能上等價的基因產(chǎn)物的序列?;虍a(chǎn)物本身可含有氨基酸殘基的缺失、添加或取代,仍然得到功能上等價的多肽。本發(fā)明的核酸序列可經(jīng)過工程改造,來為了各種目的改變編碼序列,包括但不限于修改基因產(chǎn)物加工和表達(dá)的改變。例如,可用另一種分泌信號取代天然的分泌信號,和/或用本領(lǐng)域已知的技術(shù),例如定點(diǎn)誘變引入突變,來插入新限制性位點(diǎn),改變糖基化模式,磷酸化等。在一個實(shí)施例中,本發(fā)明的多核苷酸在任何三聯(lián)氨基酸密碼子的沉默位置改變,從而更好的符合特定宿主生物體的密碼子選擇。進(jìn)一步將本發(fā)明的多核苷酸定向到編碼所述動物膠原和明膠的變體和片段??捎酶鞣N本領(lǐng)域已知的引入合適核苷酸和氨基酸改變的方法制備這些氨基酸片段和變體。氨基酸變體構(gòu)建中的兩個重要變量是突變的位置和突變的性質(zhì)。優(yōu)選通過給予在天然中不存在的氨基酸序列的多核苷酸突變構(gòu)建膠原的氨基酸變體。在與來自不同物種的膠原中不同的位置(可變位置)或在高度保守的區(qū)域(恒定區(qū)域)中制備這些氨基酸改變。這些位置上的位點(diǎn)通常被系列修飾,例如通過用保守選擇取代第一個(例如用疏水性氨基酸取代不同的疏水性氨基酸),然后用更不同的選擇(例如用疏水性氨基酸取代帶電的氨基酸)然后可在靶位點(diǎn)制造缺失和插入。氨基酸根據(jù)它們的側(cè)鏈(極性、電荷、溶解度、疏水性、親水性和/或兩性性質(zhì))分成組(1)疏水的(亮氨酸,甲硫氨酸,丙氨酸,異亮氨酸),(2)中性疏水的(半胱氨酸,絲氨酸,蘇氨酸),(3)酸性(天冬氨酸,谷氨酸),(4)弱堿性(天冬酰胺,谷氨酰胺,組氨酸),(5)強(qiáng)堿性(賴氨酸,精氨酸),(6)影響鏈取向的殘基(甘氨酸,脯氨酸)和(7)芳族(色氨酸,酪氨酸,苯丙氨酸)。保守改變包括一個氨基酸位置與“天然”氨基酸同一組內(nèi)的改變的變體。溫和保守改變包括一個氨基酸位置的變體,它在與“天然”氨基酸密切相關(guān)的組中(例如中性疏水變?yōu)槿鯄A性)。非保守改變包括一個氨基酸位置的改變,它在與“天然”氨基酸很不相關(guān)的組中(如疏水的變?yōu)閺?qiáng)堿性或酸性)。氨基酸序列的缺失一般在約1-30個殘基,優(yōu)選約1-10個殘基,通常是連續(xù)的。氨基酸插入包括氨基和/或羧基末端融合長度在1-100個或以上的殘基范圍,以及在序列內(nèi)插入一個或多個氨基酸殘基。序列內(nèi)插入的范圍一般在約i-10個氨基酸殘基,優(yōu)選1-5個殘基。末端插入的例子包括分泌或在不同宿主細(xì)胞中胞內(nèi)靶向必需的異源信號序列。在本發(fā)明的另一個實(shí)施例中,本發(fā)明的多核苷酸可與異源序列連接,編碼融合蛋白。例如,融合蛋白可經(jīng)工程改造,含有本發(fā)明的在α1(I)牛膠原序列和異源蛋白質(zhì)序列之間的切割位點(diǎn),從而可將α1(I)膠原與異源分子切開。還可根據(jù)本領(lǐng)域熟知的方法產(chǎn)生多核苷酸變體。在本發(fā)明的一個實(shí)施例中,多核苷酸通過定點(diǎn)誘變改變。該方法使用編碼所需氨基酸變體的多核苷酸序列的寡核苷酸序列,以及在改變的氨基酸兩側(cè)足夠的鄰接核苷酸,在要改變的位點(diǎn)兩側(cè)的任一側(cè)形成穩(wěn)定的雙鏈體。一般定點(diǎn)誘變技術(shù)是本領(lǐng)域技術(shù)人員熟知的,例如出版物Edelman等(1983)DNA2183說明了該技術(shù)。Zoller和Smith(1982)NucleicAcidsRes.106487-6500描述了多核苷酸序列中產(chǎn)生位點(diǎn)專一性改變的多用途和有效的方法。如本領(lǐng)域已知的,核酸突變不必要改變多核苷酸序列編碼的氨基酸序列,但提供用于操縱分子的獨(dú)特限制性位點(diǎn)。因此,經(jīng)修飾的分子可由許多不連續(xù)區(qū)域,或D-區(qū)構(gòu)成,側(cè)接獨(dú)特的限制性位點(diǎn)。該分子的這些不連續(xù)區(qū)在本文中稱為盒。本發(fā)明包含一個盒的多個拷貝形成的分子。本發(fā)明還包括重組或突變的核酸分子或盒,它們提供了所需特征,例如抗內(nèi)源性酶,如膠原酶(見例如Maniatis等,見上;和Ausubel等,見上)。本領(lǐng)域技術(shù)人員應(yīng)理解,由于基因密碼的簡并性,可產(chǎn)生多種編碼本發(fā)明的多肽或其功能性等價物的多核苷酸序列,其中某些與任何已知或天然存在的基因的核苷酸序列同源性最小。因此,本發(fā)明考慮可結(jié)合基于可能的密碼子選擇產(chǎn)生的核苷酸序列的每種和每一個可能變化。根據(jù)標(biāo)準(zhǔn)三聯(lián)體基因密碼產(chǎn)生這些組合。本發(fā)明還包括完全通過合成化學(xué)產(chǎn)生編碼本發(fā)明的多肽或其功能性等價物的多核苷酸序列或其片段。在產(chǎn)生后可將合成的序列用本領(lǐng)域熟知的試劑插入許多可得的表達(dá)載體和細(xì)胞系統(tǒng)的任一。另外,可用合成化學(xué)在編碼膠原或其功能性等價物的多核苷酸序列中引入突變。還可用PCR來建立本發(fā)明的突變。當(dāng)用小量模板核酸作為起始材料,序列與模板核酸中的相應(yīng)區(qū)域略有不同的引物可產(chǎn)生所需的氨基酸變體。PCR擴(kuò)增得到一群與在引物特異的位置編碼膠原的多核苷酸模板不同的產(chǎn)物多核苷酸片段。產(chǎn)物片段代替了質(zhì)粒中相應(yīng)的區(qū)域,建立了所需核酸或氨基酸變體。由于基因密碼固有的簡并性,本發(fā)明還包括基本編碼相同或功能上等價的多肽序列的其它多核苷酸序列,還特別考慮了所有簡并變體和密碼子優(yōu)化的序列。天然、合成、半合成或重組的編碼多核苷酸序列可用于所要求的發(fā)明的實(shí)施。這些多核苷酸序列包括能與合適的多核苷酸序列在嚴(yán)格條件下雜交的那些。如天然產(chǎn)生的,膠原是結(jié)構(gòu)蛋白,含有一種或多種膠原亞基,它們一起形成至少一個三鏈螺旋結(jié)構(gòu)域。利用各種酶,以將膠原亞基轉(zhuǎn)化成前膠原或其它前體分子,然后轉(zhuǎn)化成成熟膠原。這些酶包括例如脯氨酰4-羥化酶、C-蛋白酶、N-蛋白酶、賴氨酰氧化酶、賴氨酰羥化酶等。脯氨酰4-羥化酶是α2β2四聚體,在所有膠原的生物合成中起到了中心作用,4-羥脯氨酸殘基使新合成的多肽鏈折疊成穩(wěn)定三鏈螺旋分子的過程穩(wěn)定(見例如Prockop等(1995)Annu.Rev.Biochem.64403-434;Kivirikko等(1992)“蛋白質(zhì)的翻譯后修飾”pp.1-51;和Kivirikko等(1989)FASEBJ.31609-1617)。另外,III型膠原表達(dá)的水平在不存在重組脯氨酰4-羥化酶時比存在時低。已克隆了脯氨酰4-羥化酶的人同工型,并確定了特征(見例如Helaakoski等(1995)Proc.Natl.Acad.Sci.924427-4431;美國專利號5,928,922)。賴氨酰羥化酶,一種α2同二聚物,催化膠原的翻譯后修飾,在膠原內(nèi)形成羥賴氨酸。一般見Kivirikko等(1992)蛋白質(zhì)的翻譯后修飾,Harding,J.J.和Crabbe,M.J.C.編,CRCPress,BocaRaton,F(xiàn)L;和Kivirikko(1995)醫(yī)學(xué)生物學(xué)原理,卷3,細(xì)胞器和胞外基質(zhì),Bittar,E.E.和Bittar,N.編,JAIPress,Greenwich,GreatBritain??寺『丸b定了賴氨酰羥化酶的同工型(見例如Passoja等(1998)Proc.Natl.Acad.Sci.95(18)10482-10486;和Valtavaara等(1997)J.Biol.Chem.272(1)6831-6834)。C-蛋白酶通過切下前膠原的C-末端加工裝配的前膠原,該末端幫助裝配但不是膠原分子三鏈螺旋的部分(見例如Kadler等(1987)J.Biol.Chem.26215969-15701;和Kadler等(1990)Ann.NYAcad.Sci.580214-224)。N-蛋白酶通過切下前膠原的N-末端加工裝配的前膠原,該末端幫助裝配但不是膠原三鏈螺旋的部分(見例如Hojima等(1987)J.Biol.Chem.26911381-11390)。賴氨酰氧化酶是一種胞外銅酶,催化某些賴氨酸和羥賴氨酸殘基中α-氨基的氧化性脫氨基,形成反義性醛。然后這些醛經(jīng)過醇醛縮合形成醇醛,交聯(lián)膠原纖維??稍诶鏚ivirikko(1995),見上,Kagan(1994)Path.Res.Pract.190910-919;Kenyon等(1993)J.Biol.Chem.268(25)18435-18437;Wu等(1992)J.Biol.Chem.267(34)24199-24206;Mariani等(1992)Matrix12(3)242-248;和Hamalainen等(1991)Genomics11(3)508-516中找到賴氨酰氧化酶的DNA和蛋白序列的信息。報道了編碼許多這些翻譯后酶的核酸序列(見例如Vuori等(1992)Proc.Natl.Acad.Sci.USA897467-7470;和Kessler等(1996)Science271360-362)。編碼各種翻譯后酶的核酸序列還可根據(jù)上面一般描述的方法確定,包括使用合適的探針和核酸文庫。本發(fā)明的重組動物明膠可用本領(lǐng)域已知的各種方法衍生自動物膠原(見例如Veis,A.(1965)InternationalReviewofConnectiveTissueResearch,3113-200)例如目前加工的共同特征是膠原蛋白的二級結(jié)構(gòu)變性,在大部分情況下是膠原的一級或三級結(jié)構(gòu)改變。因此本發(fā)明的動物膠原可用不同方法加工,視所需明膠類型決定??蓮闹亟M產(chǎn)生的膠原或前膠原或其它膠原性多肽,用各種本領(lǐng)域已知的方法衍生本發(fā)明的重組動物明膠。例如,明膠可直接從細(xì)胞團(tuán)塊或培養(yǎng)基中通過利用明膠在升溫下的溶解度提高,及其在低或高pH,低或高鹽濃度和高溫下的穩(wěn)定性衍生出來。從膠原產(chǎn)生明膠組合物的方法、過程和技術(shù)包括利用去污劑、熱或各種本領(lǐng)域熟知的變性劑使膠原的三鏈螺旋結(jié)構(gòu)變性。另外,可用與從動物和屠宰場來源提取明膠有關(guān)的各種步驟,包括用石灰或酸處理,在水溶液中熱提取,離子交換層析、交叉流過濾和各種干燥方法,從重組膠原中衍生本發(fā)明的明膠。表達(dá)本產(chǎn)生動物膠原和明膠的方法可用于各種本領(lǐng)域可得的重組系統(tǒng)。本文描述了許多這樣的重組系統(tǒng),雖然應(yīng)理解本方法的應(yīng)用不限于下文舉例說明的系統(tǒng)。為了表達(dá)本發(fā)明的重組動物膠原和明膠,或可衍生出重組明膠的多肽,將編碼多核苷酸插入合適的表達(dá)載體,即含有摻入的編碼序列轉(zhuǎn)錄和翻譯必需的元件的載體,或在RNA病毒載體情況下,復(fù)制和翻譯必需的元件的載體??捎帽绢I(lǐng)域技術(shù)人員熟知的方法構(gòu)建含有本發(fā)明的多核苷酸和合適的轉(zhuǎn)錄/翻譯控制信號的表達(dá)載體。這些方法包括標(biāo)準(zhǔn)DNA克隆技術(shù),例如體外重組技術(shù),合成技術(shù)和體內(nèi)重組/基因重組(見例如,Maniatis等,見上和Ausubel等,見上所描述的技術(shù))。不同系統(tǒng)的表達(dá)元件強(qiáng)度和專一性都不同。由所用的宿主/載體系統(tǒng)而定,許多合適的轉(zhuǎn)錄和翻譯元件,包括組成型和誘導(dǎo)型啟動子,任一都可用于表達(dá)載體。例如,當(dāng)在細(xì)菌系統(tǒng)中克隆時,可使用誘導(dǎo)型啟動子,例如噬菌體γplac的pL,ptrp,ptac(ptrp-lac雜交啟動子)等;當(dāng)在昆蟲細(xì)胞系統(tǒng)中克隆時,可使用桿狀病毒多角體啟動子等啟動子;當(dāng)在植物細(xì)胞系統(tǒng)中克隆時,可使用衍生自植物細(xì)胞基因組的啟動子(例如熱休克啟動子;核酮糖-1,5-二磷酸羧化酶-加氧酶(RUBISCO)小亞基的啟動子;葉綠素a/b結(jié)合蛋白啟動子)或來自植物病毒(如花椰菜花葉病毒(CaMV)的35SRNA啟動子;煙草花葉病毒(TMV)的外被蛋白啟動子);當(dāng)在哺乳動物細(xì)胞系統(tǒng)中克隆時,可使用衍生自哺乳動物細(xì)胞基因組的啟動子(如金屬硫蛋白啟動子)或來自哺乳動物病毒(如腺病毒晚期啟動子;痘苗病毒7.5K啟動子)的啟動子;當(dāng)產(chǎn)生含有多個膠原DNA拷貝的細(xì)胞系時,可與合適的可選擇標(biāo)記一起使用基于猴病毒40(SV40)、牛乳頭瘤病毒(BPV)和EB病毒(EBV)的載體。專一性起始信號也可以是有效翻譯插入序列所需的。這些信號包括ATG起始密碼子和鄰接的序列。就將整個膠原基因,包括其自身的起始密碼子和鄰接序列插入合適的表達(dá)載體而言,不需要額外的翻譯控制信號。然而對于僅插入一部分膠原編碼序列情況下,必須提供外源翻譯控制信號,包括ATG起始密碼子。另外,起始密碼子必須與膠原編碼序列的閱讀框協(xié)調(diào),來確保整個插入物的翻譯。這些外源翻譯控制信號和起始密碼子可以是各種來源,天然和合成的兩種來源。表達(dá)效力可通過摻入合適的轉(zhuǎn)錄增強(qiáng)子元件、轉(zhuǎn)錄終止子等增強(qiáng)(見例如Bittner等(1987)MethodsinEnzymol,153516-544)。本發(fā)明的多肽可以表達(dá)成分泌蛋白。當(dāng)用于表達(dá)蛋白質(zhì)的經(jīng)工程改造的細(xì)胞是非人宿主細(xì)胞,用另一種能被宿主細(xì)胞的分泌靶向機(jī)制更有效識別的可變的分泌信號肽替換膠原蛋白的分泌信號肽常常是有利的。合適的分泌信號序列對于獲得最佳真菌表達(dá)哺乳動物基因特別重要。例如見Brake等(1984)Proc.Natl.Acad.Sci.USA814642。原核、酵母、真菌、昆蟲或哺乳動物細(xì)胞的其它信號序列是本領(lǐng)域熟知的,本領(lǐng)域普通技術(shù)人員能夠簡單的選擇適于所選宿主細(xì)胞的信號序列。本發(fā)明的載體可在宿主細(xì)胞中自動復(fù)制,或可以整合入宿主基染色體。具有對于原核細(xì)胞和真核細(xì)胞的各種細(xì)菌、酵母和各種病毒復(fù)制序列的具有自動復(fù)制序列的合適載體是熟知的。當(dāng)載體和宿主細(xì)胞基因組DNA中發(fā)現(xiàn)的序列有同源核苷酸序列時,載體可整合到宿主細(xì)胞基因組中。在一個實(shí)施例中,本發(fā)明的表達(dá)載體含有一個可選擇標(biāo)記,它編碼宿主細(xì)胞在某些條件下生長和存活必需的產(chǎn)物。典型的選擇基因包括編碼賦予對抗生素或其它毒素(如四環(huán)素、氨芐青霉素、新霉素、氨甲蝶呤等)的抗性的蛋白質(zhì),補(bǔ)償宿主細(xì)胞營養(yǎng)缺陷要求的蛋白質(zhì)等。選擇基因的其它例子包括單純皰疹病毒胸腺嘧啶脫氧核苷激酶(Wigler等(1977)Cell11223),次黃嘌呤-鳥嘌呤磷酸核糖轉(zhuǎn)移酶(Srybalska等(1962)Prot,Natl.Acod.Sci.USA482026)腺嘌呤磷酸核糖轉(zhuǎn)移酶(Lowy等(1980)Cell22817)基因,可分別在tk-,hgprf;或aprf細(xì)胞中使用??捎每勾x物抗性作為選擇的基礎(chǔ),例如用賦予氨甲蝶呤抗性的dhfr;抗霉酚酸的gpt抗性;neo,對氨基糖苷G-418賦予抗性;和hygro,對潮霉素賦予抗性(見例如Wigler等(1980)Proc.Natl.Acad.Sci.USA773567;O’Hare等(1981)Proc.Natl.Acad.Sci.USA781527;Mulligan等(1981)Proc.Natl.Acad.Sci.USA782072;Colberre-Garapin等(1981)J.Mol.Biol.1501;和Santerre等(1984)Gene30147)。其它可選擇基因包括trpB,它使細(xì)胞利用吲哚以取代色氨酸;hisD,它使細(xì)胞利用組氨醇以取肛組氨酸;和odc(鳥氨酸脫羧酶),它賦予對鳥氨酸脫羧酶抑制劑,2-(二氟甲基)-DL-鳥氨酸,DFMO的抗性。(見例如Hartman等(1988)Proc.Natl.Acad.Sci.USA858047和McConlogueL.于CurrentCommunicationsinMolecularBiology,ColdSpringHarborLaboratory編(1987))。表達(dá)本發(fā)明的載體必需的元件包括引發(fā)轉(zhuǎn)錄的序列,例如啟動子和增強(qiáng)子。啟動子是位于結(jié)構(gòu)基因起始密碼子上游的非翻譯序列,它控制核酸在其控制下轉(zhuǎn)錄??烧T導(dǎo)啟動子是響應(yīng)培養(yǎng)條件的改變,例如存在或不存在一種營養(yǎng)物的改變,以改變其轉(zhuǎn)錄起始水平的啟動子。本領(lǐng)域技術(shù)人員知道許多可在適合本發(fā)明的宿主細(xì)胞中可被識別的啟動子。這些啟動子通過從其天然基因上除去啟動子,并在啟動子序列放置編碼膠原的DNA,與編碼膠原的DNA3’可操縱性連接。本發(fā)明中有用的啟動子包括但不限于乳糖啟動子、堿性磷酸酶啟動子、色氨酸啟動子、雜交啟動子例如tac啟動子,3-磷酸甘油酸激酶啟動子,其它糖酵解酶啟動子(己糖激酶、丙酮酸脫羧酶、果糖磷酸激酶、葡萄糖-6-磷酸異構(gòu)酶等),醇脫氫酶啟動子、金屬硫蛋白啟動子、麥芽糖啟動子、半乳糖啟動子、多瘤病毒、禽痘病毒、腺病毒、牛乳頭瘤病毒、禽肉瘤病毒、巨細(xì)胞病毒、逆轉(zhuǎn)錄病毒、猴病毒40的啟動子和來自包括曲霉屬的葡糖淀粉酶啟動子的靶真核細(xì)胞的啟動子,肌動蛋白啟動子或哺乳動物的免疫球蛋白啟動子和天然膠原啟動子(見例如Boer等(1983)Proc.Natl.Acad.Sci.USA8021-25;Hitzeman等(1980)J.Biol.Chem.2552073;Fiers等(1978)Nature273113;Mulligan和Berg(1980)Science2091422-1427;Pavlakis等(1981)Proc.Natl.Acad.Sci.USA787398-7402;Greenway等(1982)Gene18355-360;Gray等(1982)Nature295503-508;Reyes等(1982)Nature297598-601;Canaani和Berg(1982)Proc.Natl.Acad.Sci.USA795166-5170;Gorman等(1982)Proc.Natl.Acad.Sci.USA796777-6781;和Nunberg等(1984)Mol.andCell..Biol.11(4)2306-2315)。啟動子編碼序列的轉(zhuǎn)錄通常是通過在載體中插入增強(qiáng)子序列提高的。增強(qiáng)子是順式激活元件,通常約10-300bp,它起到提高啟動子轉(zhuǎn)錄起始速率的作用。許多增強(qiáng)子對于真核細(xì)胞和原核細(xì)胞兩者都是已知的,普通技術(shù)人員可為感興趣的宿主細(xì)胞選擇合適的增強(qiáng)子(見例如Yaniv(1982)Nature29717-18)。另外,可選擇宿主細(xì)胞株,它調(diào)節(jié)插入序列的表達(dá),或以所需的特定方式修飾和加工基因產(chǎn)物。這種蛋白質(zhì)產(chǎn)物的修飾(例如糖基化)和加工(例如切割)可以是對蛋白質(zhì)功能可能是重要的。不同宿主細(xì)胞具有蛋白質(zhì)翻譯后加工和修飾的特征性和專一性的機(jī)制。可選擇合適的細(xì)胞系或宿主細(xì)胞以確保表達(dá)的外源蛋白質(zhì)的正確修飾和加工。對此,可使用具有基因產(chǎn)物的一級轉(zhuǎn)錄物,糖基化和磷酸化正確加工細(xì)胞機(jī)制的真核宿主細(xì)胞。這些哺乳動物宿主細(xì)胞包括但不限于CHO、VERO、BHK、HeLa、COS、MDCK、293、WI38等。另外,可工程改造宿主細(xì)胞來表達(dá)各種酶,確保編碼的多肽的正確加工。例如,可使脯氨酰4-羥化酶的基因與編碼膠原或其片段或變體的多核苷酸共表達(dá),實(shí)現(xiàn)正確羥基化。為了長期、高產(chǎn)率產(chǎn)生重組蛋白,優(yōu)選穩(wěn)定表達(dá)。例如,可工程改造穩(wěn)定表達(dá)本發(fā)明膠原的細(xì)胞系。不使用含有病毒復(fù)制起始點(diǎn)的表達(dá)載體,而用受合適表達(dá)控制元件(例如啟動子、增強(qiáng)子序列,轉(zhuǎn)錄終止子、聚腺苷酸位點(diǎn)等)和可選擇標(biāo)記控制的編碼膠原的DNA轉(zhuǎn)化宿主細(xì)胞。引入外源DNA后,在富集培養(yǎng)基中使工程改造的細(xì)胞生長1-2日,然后切換到選擇性培養(yǎng)基。重組質(zhì)粒中的選擇性標(biāo)記對選擇賦予抗性,使細(xì)胞將質(zhì)粒穩(wěn)定整合入其染色體,并生長形成灶,從而能克隆并擴(kuò)增成細(xì)胞系。因此,本方法可有利的用于工程改造表達(dá)所需動物膠原或其片段或變體的細(xì)胞。例如,由半乳糖啟動子驅(qū)動的本發(fā)明的多肽表達(dá)可通過在非抑制、非誘導(dǎo)糖上生長培養(yǎng),從而在加入半乳糖后非常迅速的誘導(dǎo);在葡萄糖培養(yǎng)基中培養(yǎng)培養(yǎng)物,然后通過離心和洗滌細(xì)胞除去葡萄糖,重新懸浮在半乳糖培養(yǎng)基中;通過使細(xì)胞在含有葡萄糖和半乳糖的培養(yǎng)基中生長,從而在半乳糖誘導(dǎo)發(fā)生前優(yōu)先代謝葡萄糖??捎帽绢I(lǐng)域技術(shù)人員已知的技術(shù)將表達(dá)本發(fā)明的多肽的載體和表達(dá)編碼任何所需的翻譯后酶的多核苷酸的載體引入宿主細(xì)胞,來產(chǎn)生編碼的多肽。例如,可用上述表達(dá)載體轉(zhuǎn)染或感染或轉(zhuǎn)化宿主細(xì)胞,并在適合選擇含有編碼膠原的載體的轉(zhuǎn)導(dǎo)子或轉(zhuǎn)化子的營養(yǎng)培養(yǎng)基中培養(yǎng)??捎酶鞣N本領(lǐng)域技術(shù)人員已知的方法進(jìn)行細(xì)胞轉(zhuǎn)染,例如磷酸鈣沉淀,電穿孔和脂轉(zhuǎn)染技術(shù)(見例如Maniatis等,見上,Ohta,T.(1996)NipponRinsho54(3)757-764;Trotter和Wood(1996)MolBiotechnol6(3)329-334;Mann和King(1989)JGenVirol703501-3505;和Hartig等(1991)Biotechniques11(3)310)。在一個實(shí)施例中,本發(fā)明提供了本發(fā)明提供了一種方法,其中一個以上編碼本發(fā)明的多肽的表達(dá)載體被插入細(xì)胞中,從而例如可合成三聚膠原。例如,在本發(fā)明的一種產(chǎn)生動物膠原的方法中,可以用第一種含有編碼豬α1(I)膠原的多核苷酸的載體和第二個含有編碼豬α2(I)膠原的多核苷酸的載體,和第三和第四個含有編碼脯氨酰4-羥化酶的α亞基和β亞基的載體在適合多肽和完全羥化的異三聚豬膠原表達(dá)的條件下共感染、共轉(zhuǎn)染或共轉(zhuǎn)化細(xì)胞。在本發(fā)明的另一種方法中,考慮了同三聚體膠原的生產(chǎn)。例如,在產(chǎn)生牛膠原III型時,可用第一種含有編碼牛α1(III)膠原的多核苷酸的載體,第二種含有編碼脯氨酰4-羥化酶α亞基的多核苷酸的載體和第三種含有編碼脯氨酰4-羥化酶β亞基的多核苷酸的載體共感染、共轉(zhuǎn)染或共轉(zhuǎn)化細(xì)胞。其它動物膠原,包括哺乳動物膠原例如豬、羊和馬膠原,和非哺乳動物動物膠原,例如雞和魚膠原,可在本領(lǐng)域技術(shù)水平內(nèi)用相同或相似共表達(dá)方法和技術(shù)來產(chǎn)生,以及其變體產(chǎn)生??梢杂帽绢I(lǐng)域已知任何數(shù)量的技術(shù)鑒定含有編碼序列和表達(dá)生物活性基因產(chǎn)物的宿主細(xì)胞。這些技術(shù)包括例如檢測核酸雜交復(fù)合物的形成,通過測量宿主細(xì)胞中mRNA轉(zhuǎn)錄物表達(dá)評估轉(zhuǎn)錄水平檢測存在或不存在標(biāo)記基因功能,和通過免疫測定法或生物活性檢測基因產(chǎn)物。在第一個方法中,可通過例如檢測DNA-DNA或DNA-RNA雜交復(fù)合物,或通過用含有與動物膠原編碼序列或部分或其衍生物同源的核苷酸序列的引物擴(kuò)增來檢測所提呈的多核苷酸的存在?;跀U(kuò)增的檢測涉及用基于與感興趣的編碼序列同源的序列的寡核苷酸或寡聚物來檢測含有編碼的多核苷酸的轉(zhuǎn)化物。在第二個方法中,基于存在或不存在某種標(biāo)記基因功能(例如胸腺嘧啶激酶活性,對抗生素的抗性,對氨甲蝶呤的抗性,轉(zhuǎn)化表型,桿狀病毒中包含體的形成),重組表達(dá)載體/宿主系統(tǒng)被鑒定和選擇。例如,如果編碼序列插入載體的標(biāo)記基因序列內(nèi),可由不存在標(biāo)記基因功能能鑒定出含有編碼序列的重組細(xì)胞。另外,可將標(biāo)記基因置入,并與編碼序列串聯(lián),置于相同或不同的啟動子控制下,用于控制該編碼序列表達(dá)。對應(yīng)于誘導(dǎo)或選擇的標(biāo)記的表達(dá)表明編碼序列的表達(dá)。在第三個方法中,編碼區(qū)的轉(zhuǎn)錄活性可通過雜交測定評估。例如,可用與編碼序列或其特定部分同源的探針RNA印跡分離和分析RNA。另外,可抽提宿主細(xì)胞的總核酸,測定與這些探針的雜交。在第四個方法中,用免疫學(xué)方法測定蛋白質(zhì)產(chǎn)物的表達(dá),例如用蛋白質(zhì)印跡,和諸如放免法-沉淀、酶聯(lián)免疫分析等免疫等試驗(yàn)。在一個實(shí)施例中,本發(fā)明的動物膠原分泌入培養(yǎng)基,并可用各種本領(lǐng)域已知的方法,例如通過層析純化到均一。在一個實(shí)施例中,本發(fā)明的重組動物膠原用尺寸排阻層析純化。然而,還可用其它本領(lǐng)域已知的純化技術(shù),包括離子交換層析,和反相層析。(見例如Maniatis等,見上,Ausubel等,見上和Scopes(1994)ProteinPurificationPrinciplesandPractice,Springer-VerlagNewYorkInc.,NY)。本方法可用于,雖然不限于用于下列的表達(dá)系統(tǒng)。原核在原核系統(tǒng),例如細(xì)菌系統(tǒng)中,根據(jù)表達(dá)的多肽所要的用途有助于選擇許多表達(dá)載體。例如,當(dāng)要產(chǎn)生大量的本發(fā)明的動物膠原和明膠,例如產(chǎn)生抗體時,指導(dǎo)能高水平表達(dá)可容易地被純化的融合蛋白產(chǎn)物的載體是理想的。這些載體包括但不限于大腸桿菌表達(dá)載體pUR278(Ruther等(1983)EMBOJ.21791),其中可以將編碼序列連接到帶有l(wèi)azZ編碼區(qū)的閱讀框內(nèi)的載體上,從而產(chǎn)生雜交的AS-lacZ蛋白;pIN載體(Inouye等(1985)NucleicAcidsRes.133101-3109和VanHeeke等(1989).J.Biol.Chem.2645503-5509);等。pGEX載體也可用于表達(dá)作為與谷胱甘肽S-轉(zhuǎn)移酶(GST)的融合蛋白的外源多肽。一般這些融合蛋白是可溶的,并可容易地通過吸附到谷胱甘肽-瓊脂糖珠上,然后在游離谷胱甘肽的存在下洗脫,從裂解細(xì)胞中純化。該pGEX載體被設(shè)計成包含有凝血酶或因子Xa蛋白酶切割位點(diǎn),從而克隆的感興趣多肽可從GST分子上釋放。酵母在一個實(shí)施例中,本多肽在酵母表達(dá)系統(tǒng)中產(chǎn)生。在酵母中,可使用許多含有組成型或可誘導(dǎo)的啟動子的本領(lǐng)域已知的載體。(見例如Ausubel等,見上,卷2,13章;Grant等(1987)ExpressionandSecretionVectorforYeast,于MethodsinEnzymology,Wu&Grossman編,Acad.Press.N.Y.153516-544;Glover(1986)DNACloning,卷II,IRLPress,Wash,D.C.,Ch3;Bitter(1987)酵母中的異源基因表達(dá),MethodsinEnzymology,Berger&Kimmel編,Acad.Press,N.Y.152673-684;和TheMolecularBiologyoftheYeastSacchromyces,Strathern等編,ColdSpringHarborPress,卷I和II(1982))。本發(fā)明的多肽可以用宿主細(xì)胞表達(dá),例如從釀酒酵母(Saccharomycescerevisiae)表達(dá)。該特定酵母可用于許多表達(dá)載體的任一。常用表達(dá)載體是含有在酵母中增殖的2μ復(fù)制起始點(diǎn)和大腸桿菌中的ColE1起始點(diǎn)的穿梭載體,用于有效轉(zhuǎn)錄外源基因。這些基于2μ質(zhì)粒的載體的典型例子是pWYG4,它具有2μORI-STB元件,GAL1-10啟動子和2μD基因終止子。在該載體中,用Nco1克隆位點(diǎn)插入要表達(dá)多肽的基因,并提供ATG起始密碼子。另一個表達(dá)載體是pWYG7L,它具有完整的2αORI、STB、REP1和REP2,和GAL1-10啟動子,和用FLP終止子。在該載體中,編碼的多核苷酸插入多接頭,其5’末端在BamHI或Ncol位點(diǎn)。含有插入的多核苷酸的載體轉(zhuǎn)化入除去細(xì)胞壁后的釀酒酵母,以產(chǎn)生在用鈣和聚乙二醇處理后攝取DNA的原生質(zhì)球體,或轉(zhuǎn)化入用鋰離子處理完整的細(xì)胞。另外,可通過電穿孔引入DNA。例如可用具有可選擇標(biāo)記基因例如LEU2、TRP1、URA3、HIS3或Leu2-D的亮氨酸、色氨酸、尿嘧啶或組氨酸共同營養(yǎng)缺陷型的宿主酵母細(xì)胞選擇轉(zhuǎn)化子。在本發(fā)明的一個實(shí)施例中,本多核苷酸引入來自畢赤酵母(yeastpichia)的宿主細(xì)胞。非釀酒酵母的物種,例如巴斯德畢赤酵母(Pichiapastoris)似乎以增大比例中生產(chǎn)高產(chǎn)量的重組蛋白質(zhì)上有特別的優(yōu)勢。另外,從InvitrogenCorporation(SanDiego,CA)可購得畢赤表達(dá)盒。在甲基營養(yǎng)酵母,例如巴斯德畢赤酵母中有許多甲醇反應(yīng)性基因,它們各自的表達(dá)受到甲醇反應(yīng)性調(diào)控區(qū)控制,也稱為啟動子。這些甲醇反應(yīng)性啟動子任一適合用于實(shí)施本發(fā)明。特定調(diào)控區(qū)的例子包括AOX1啟動子、AOX2啟動子、二羥基丙酮合成酶(DAS)、P40啟動子和來自巴斯德畢赤酵母的過氧化氫酶基因啟動子等。在其它實(shí)施例中,本發(fā)明考慮使用甲基營養(yǎng)酵母多形漢遜酵母(Hansenulapolymorpha)。在甲醇生長導(dǎo)致誘導(dǎo)甲醇代謝的關(guān)鍵酶,例如MOX(甲醇氧化酶)、DAS(二羥丙酮合成酶)和FMHD(甲酸脫氫酶)。這些酶可占全部細(xì)胞蛋白質(zhì)的30-40%。編碼MOX、DAS和FMDH生產(chǎn)的基因受到強(qiáng)啟動子的控制,它受到在甲醇上生長的誘導(dǎo),在葡萄糖上生長的抑制。這三種啟動子或其中的任一可用于獲得異源基因在多形漢遜酵母中的高水平表達(dá)。因此,在本發(fā)明的一個方面,編碼動物膠原或其片段或變體的多核苷酸在可誘導(dǎo)的多形漢遜酵母的啟動子的控制下被克隆入表達(dá)載體。如果需要分泌產(chǎn)物,將編碼酵母分泌信號序列的多核苷酸與多核苷酸在閱讀框中連接。在另一個實(shí)施例中,表達(dá)載體優(yōu)選含有營養(yǎng)缺陷的標(biāo)記基因,例如URA3或LEU2,它們可用于補(bǔ)償營養(yǎng)缺陷宿主的缺陷性。然后用本領(lǐng)域技術(shù)人員已知的技術(shù)用表達(dá)載體轉(zhuǎn)化多形漢遜酵母宿主細(xì)胞。多形漢遜酵母轉(zhuǎn)化的一個有用特征是將多達(dá)100個表達(dá)載體拷貝自發(fā)整合到基因組中。在大多數(shù)情況下,整合的多核苷酸形成顯示頭-尾排列的多聚體。整合的外源多核苷酸在幾種重組菌株中甚至在非選擇性條件下也顯示穩(wěn)定的有絲分裂。該高拷貝整合的現(xiàn)象也幫助了該系統(tǒng)的高生產(chǎn)力性能。真菌還用絲狀真菌生產(chǎn)該多肽。在絲狀真菌中表達(dá)和/或分泌重組蛋白質(zhì)的載體是熟知的,本領(lǐng)域技術(shù)人員可用這些載體表達(dá)本發(fā)明的重組動物膠原。植物在一個方面,本發(fā)明考慮在植物和植物細(xì)胞中產(chǎn)生動物膠原和明膠。在使用植物表達(dá)載體的情況下,編碼本發(fā)明膠原的序列的表達(dá)可由許多啟動子中的任一驅(qū)動。例如,可使用病毒啟動子,如花椰菜花葉病毒(CaMV)的35SRNA和19SRNA啟動子(Brisson等,(1984)Nature310511-514),或煙草花葉病毒(TMV)的包被蛋白啟動子(Takamatsu等(1987)EMBOJ.6307-311);另外可使用植物啟動子,例如核酮糖-1,5-二磷酸羧化酶-加氧酶RUBISCO的小亞基(Coruzzi等(1984)EMBOJ.31671-1680;Broglie等(1984)Science224838-843)或熱休克啟動子,例如大豆hsp17.5-E或hsp17.3-B(Gurley等(1986)Mol.Cell.Biol.6559-565)。這些構(gòu)建物可用各種本領(lǐng)域技術(shù)人員已知的方法引入植物細(xì)胞,例如用Ti質(zhì)粒、Ri質(zhì)粒體、植物病毒載體、直接DNA轉(zhuǎn)化、顯微注射、電穿孔等。對于這些技術(shù)的回顧見例如Weissbach&Weissbach,MethodsforPlantMolecularBiology,AcademicPress,NY,VIII節(jié),pp.421-463(1988);Grierson&Corey,PlantMolecularBiology,第二版,Blackie,London,7-9章(1988);TransgenicPlantsAProductionSystemforIndustrialandPharmaceuticalProteins,Owen和Pen編,JohnWiliey&Sons,1996;TransgenicPlants,GalunandBreiman編,ImperialCollegePress,1997;和AppliedPlantBiotechnology,Chopra,Malik和Bhat編SciencePublishers,Inc,1999。植物細(xì)胞天然不產(chǎn)生足量的翻譯后酶,來有效產(chǎn)生穩(wěn)定的膠原。因此,本發(fā)明提供了如需要羥化,用必需的翻譯后酶補(bǔ)充用于表達(dá)本發(fā)明動物膠原的植物細(xì)胞,來充分產(chǎn)生穩(wěn)定的膠原。在本發(fā)明的一個優(yōu)選例中,翻譯后酶是脯氨酰4-羥化酶。在植物系統(tǒng)中產(chǎn)生本發(fā)明的動物膠原或明膠的方法可通過提供植物或植物細(xì)胞的生物質(zhì)實(shí)現(xiàn),其中植物或植物細(xì)胞含有至少一條編碼序列,它與影響多肽表達(dá)的啟動子可操縱性連接,然后從生物質(zhì)中提取多肽。另外,多肽可不提取,即在胚乳內(nèi)表達(dá)等。植物表達(dá)載體和報道基因是本領(lǐng)域已知的(見例如Gruber等(1993)MethodsofPlantMolecularBiologyandBiotechnology,CRCPress)。通常表達(dá)載體含有例如重組或合成產(chǎn)生的核酸構(gòu)建物,并含有在植物細(xì)胞中有功能的啟動子,其中這種啟動子與編碼動物膠原或其片段或變體的核酸序列,或與膠原生物合成重要的翻譯后酶可操縱性連接。啟動子驅(qū)動植物中的蛋白質(zhì)表達(dá)水平。為了在植物中產(chǎn)生所需水平的蛋白質(zhì)表達(dá),表達(dá)可以在植物啟動子的指導(dǎo)下進(jìn)行。根據(jù)本發(fā)明,適用的啟動子是本領(lǐng)域可得的。(見例如PCT出版號WO91/19806)。可根據(jù)本發(fā)明使用的啟動子的例子包括非組成型啟動子或組成型啟動子。這些啟動子包括但不限于核酮糖-1,-二磷酸羧化酶小亞基啟動子,來自根瘤土壤桿菌(Agrobateriumtumefaciens)的腫瘤誘導(dǎo)質(zhì)粒的啟動子,例如RUBISCO胭脂氨酸合成酶(NOS)和章魚堿合成酶啟動子;細(xì)菌T-DNA啟動子,例如mas和ocs啟動子;和病毒啟動子,例如花椰菜花葉病毒(CaMV)19S和35S啟動子或玄參花葉病毒(ortmosaicvirus)35S啟動子。本發(fā)明的多核苷酸序列還可以在組成型啟動子的轉(zhuǎn)錄控制下,直接在植物的大多數(shù)組織中表達(dá)膠原或翻譯后酶。在一個實(shí)施例中,多核苷酸序列在花椰菜花葉病毒(CaMV)35S啟動子的控制下。雙鏈花椰菜家族提供了植物中轉(zhuǎn)基因表達(dá)的最獨(dú)一無二的重要的啟動子表達(dá),特別是35S啟動子(見例如Kay等(1987)Science2361299)。來自該家族的其它啟動子,例如玄參花葉病毒啟動子等在領(lǐng)域中有所描述,也可根據(jù)本發(fā)明使用。(見例如Sanger等(1990)PlantMol.Biol.14433-443;Medberry等(1992)PlantCell4195-192;和Yin和Beachy(1995)PlantJ.7969-980)。如需要,可修飾用于本發(fā)明多核苷酸構(gòu)建物的啟動子,來影響其控制特征。例如,將CaMV啟動子與在無光條件下,抑制RUBISCO表達(dá)的RUBISCO基因的部分連接,來建立在葉子中活躍,在根中不活躍的啟動子。得到的嵌合啟動子可如本文所述使用。具有本領(lǐng)域已知的一般表達(dá)性能的組成型植物啟動子可用于本發(fā)明的表達(dá)載體。這些啟動子在大多數(shù)植物組織中大量表達(dá),而且包括例如肌動蛋白啟動子和遍在蛋白啟動子(見例如,McElroy等(1990)PlantCell2163-171;和Christensen等(1992)PlantMol.Biol.18675-689)。另外,本發(fā)明的多肽可在特定組織、細(xì)胞類型中,或在更精確的環(huán)境條件下或發(fā)育控制下表達(dá)。指導(dǎo)這些情況下表達(dá)的啟動子稱為誘導(dǎo)型啟動子。就使用組織特異性啟動子的情況而言,蛋白質(zhì)表達(dá)在需要提取蛋白質(zhì)的組織中特別高。視所需組織而定,表達(dá)可靶向胚乳、糊粉層、種胚(或其部分如胚鱗和子葉)、果皮、莖、葉、塊莖、根等。已知的組織特異性啟動子的例子包括指向塊莖(tuber-directed)的I類patatin啟動子,與馬鈴薯塊莖ADPGPP基因相關(guān)的啟動子,大豆β-conglycinin(7S蛋白)啟動子,它驅(qū)動針對種子的轉(zhuǎn)錄,和來自玉米胚乳玉米醇溶蛋白基因的針對種子的啟動子(見例如Bevan等(1986)NucleicAcidsRes.144625-38;Muller等(1990)Mol.Gen.Genet.224136-46;Bray(1987)Planta172364-370;和Pederson等(1982)Cell291015-26)。在一個優(yōu)選例中,本發(fā)明的多肽通過基于種子的生產(chǎn)技術(shù),使用例如蕓苔、玉米、大豆、水稻和大麥種子在種子中生產(chǎn)。在該過程中,例如產(chǎn)物在種子發(fā)芽中被回收。(見例如PCT出版號WO9940210;WO9916890;WO9907206;美國專利號5,866,121;美國專利號5,792,933;所有文獻(xiàn)在此引入以供參考)??捎糜谥笇?dǎo)多肽表達(dá)的啟動子可以是異源或非異源的。這些啟動子還可用于驅(qū)動反義核酸的表達(dá),在所需組織中減弱,提高或改變本發(fā)明的動物膠原的濃度和組合物??捎糜谔岣吆?或使本發(fā)明的多肽在植物或植物細(xì)胞中的轉(zhuǎn)錄最大化的其它修改是本領(lǐng)域已知的和標(biāo)準(zhǔn)化的。例如,含有編碼重組動物膠原或明膠的多核苷酸序列,或可衍生出重組動物明膠的多肽或其片段或變體,與一啟動子可操縱連接的載體還可包含至少一種因子,它改變膠原或相關(guān)翻譯后酶的轉(zhuǎn)錄速度,包括但不限于肽輸出信號序列、密碼子使用、內(nèi)含子、聚腺苷酸化和轉(zhuǎn)錄終止位點(diǎn)。修飾構(gòu)建物以提高在植物中表達(dá)水平的方法通常是本領(lǐng)域已知的(見例如Rogers等(1985)J.Biol.Chem.2603731;和Cornejo等(1993)PlantMolBiol23567-58)。在工程改造影響本發(fā)明膠原和相關(guān)翻譯后酶轉(zhuǎn)錄速率的植物系統(tǒng)中,各種本領(lǐng)域已知的因素,包括調(diào)控序列,例如正或負(fù)激活序列、增強(qiáng)子和沉默子,以及可以影響植物的轉(zhuǎn)錄速率的染色質(zhì)結(jié)構(gòu)。本發(fā)明提供了這些因素的至少一種,可用于表達(dá)本文所述的重組動物膠原和明膠。含有本發(fā)明多核苷酸的載體通常含有一標(biāo)記基因,它賦予植物細(xì)胞選擇性表型。通常選擇性標(biāo)記基因因帶有合適的基因?qū)⒕幋a抗生素抗性,這些合適的基因包括至少下列基因的一種,編碼對抗生素壯觀霉素抗性的基因,編碼鏈霉素抗性的鏈霉素磷酸轉(zhuǎn)移酶(SPT)基因、編碼卡那霉素或遺傳霉素抗性的新霉素磷酸轉(zhuǎn)移酶(NPTH)基因,潮霉素抗性,編碼對除草劑特別是磺酰脲型除草劑抗性的基因,它用于抑制乙酰乳酸合成酶(ALS)的基因,(如乙酰乳酸合成酶(ALS)基因,它含有導(dǎo)致特別是S4和/或Hra突變的這種抗性),含有抑制谷氨酰胺合成酶作用的突變的基因,例如phophinothricin和basra(例如bar基因)或其它本領(lǐng)域已知的類似基因。bar基因編碼對除草劑basta的抗性,nptII基因編碼對抗生素卡那霉素和遺傳霉素的抗性,ALS基因編碼對除草劑綠黃酮的抗性。用于在植物中表達(dá)外源基因的典型載體是本領(lǐng)域熟知的,包括但不限于衍生自根瘤土壤桿菌的腫瘤誘導(dǎo)性(Ti)質(zhì)粒的載體。這些載體是植物整合載體,它們在轉(zhuǎn)化后,將一部分DNA整合入宿主植物的基因組(見例如Roger等(1987)Meth.InEnzymol.153253-277;Schardl等(1987)Gene611-11;和Berger等;Proc.Natl.Acad.Sci.USA868402-8406)。含有編碼本發(fā)明多肽的序列的載體和含有翻譯后酶或其亞基的載體可共同引入所需植物。轉(zhuǎn)化植物細(xì)胞的方法是本領(lǐng)域已知的,例如直接基因轉(zhuǎn)移,體外原生質(zhì)體轉(zhuǎn)化,植物病毒介導(dǎo)的轉(zhuǎn)化,脂質(zhì)體介導(dǎo)的轉(zhuǎn)化,顯微注射,電穿孔,土壤桿菌介導(dǎo)的轉(zhuǎn)化和顆粒轟擊。(見例如Paszkowski等(1984)EMBOJ.32717-2722;美國專利號4,684,611;歐洲申請?zhí)?67553;美國專利號4,407,956;美國專利號4,536,475;Crossway等(1986)Biotechniques4320-334;Riggs等(1986)Proc.Natl.Acad.Sci.USA835602-5606;Hinchee等(1988)Biotechnology6915-921;和美國專利號4,945,050)。本領(lǐng)域描述了轉(zhuǎn)化例如水稻、小麥、玉米、高粱和大麥的標(biāo)準(zhǔn)方法(見例如Christou等(1992)TrendsinBiotechnology10239和Lee等(1991)Proc.Natl.Acad.Sci.USA886389)??捎门c轉(zhuǎn)化玉米或水稻類似的技術(shù)轉(zhuǎn)化小麥。另外,Casas等(1993)Proc.Natl.Acad.Sci.USA9011212描述了一種轉(zhuǎn)化高粱的方法,而Wan等(1994)PlantPhysiol.10437描述了一種轉(zhuǎn)化大麥的方法。Fromm等(1990)Bio/Technology8833和Gordon-Kamm等見上提供了轉(zhuǎn)化玉米的合適方法。在本領(lǐng)域建立了其它可用于產(chǎn)生生產(chǎn)本發(fā)明的動物膠原的植物的方法。(見例如美國專利號5,959,091;美國專利號5,859,347;美國專利號5,763,241;美國專利號5,659,122;美國專利號5,593,874;美國專利號5,495,071;美國專利號5,424,412;美國專利號5,362,865;美國專利號5,229,112;美國專利號5,981,841;美國專利號5,959,179;美國專利號5,932,439;美國專利號5,869,720;美國專利號5,804,425;美國專利號5,763,245;美國專利號5,716,837;美國專利號5,689,052;美國專利號5,633,435;美國專利號5,631,152;美國專利號5,627,061;美國專利號5,602,321;美國專利號5,589,612;美國專利號5,510,253;美國專利號5,503,999;美國專利號5,378,619;美國專利號5,349,124;美國專利號5,304,730;美國專利號5,185,253;美國專利號4,970,168;歐洲出版號EPA00709462;歐洲出版號EPA00578627;歐洲出版號EPA00531273;歐洲出版號EPA00426641;PCT出版號WO93/31248;PCT出版號WO98/58069;PCT出版號WO98/45457;PCT出版號WO98/31812;PCT出版號WO98/08962;PCT出版號WO97/48814;PCT出版號WO97/30582;和PCT出版號WO9717459)。昆蟲根據(jù)本發(fā)明的方法使用的另一種表達(dá)系統(tǒng)是昆蟲系統(tǒng)。桿狀病毒是在昆蟲細(xì)胞中大量產(chǎn)生各種重組蛋白的非常有效的載體。在例如Luckow等(1989)Virology17031-39和Gruenwald,S.和Heitz,J.(1993)BaculovirusExpressionVectorSystemProcedures&MethodsManual,Pharmingen,SanDiego,CA所述的流程和方法可用于構(gòu)建含有本發(fā)明膠原的膠原編碼序列和合適的轉(zhuǎn)錄/翻譯調(diào)控信號的表達(dá)載體。例如,可在昆蟲細(xì)胞中通過用編碼多肽的桿狀病毒感染,實(shí)現(xiàn)蛋白重組產(chǎn)生。在本發(fā)明的一個方面,用穩(wěn)定的三鏈螺旋產(chǎn)生的重組多肽可涉及用三個桿狀病毒共同感染昆蟲細(xì)胞,一個編碼要表達(dá)的動物膠原,另兩個分別表達(dá)脯氨酰4-羥化酶的α和β亞基。該昆蟲細(xì)胞系統(tǒng)能大量產(chǎn)生重組蛋白。在該系統(tǒng)中,用苜蓿銀紋夜蛾(Autographacalifornica)核型多角體病毒(AcNPV)作為表達(dá)異源基因的載體。病毒在草地夜蛾(Spodopterafrugiperda)細(xì)胞中生長。本發(fā)明的多肽的編碼序列可克隆入該病毒的非必需區(qū)域(例如多角體基因),置于AcNPV啟動子的控制下(例如多角體啟動子)。編碼序列的成功插入將導(dǎo)致多角體基因失活,產(chǎn)生無包含體(non-occluded)重組病毒(即缺乏多角體基因編碼的蛋白質(zhì)包被的病毒)。然后用這些重組的病毒感染草地夜蛾細(xì)胞,在其中表達(dá)插入的基因。(見例如Smith等,(1983)J.Virol.46584;和美國專利號4,215,051)。該表達(dá)系統(tǒng)的其它例子可在例如Ausubel等見上述內(nèi)容中發(fā)現(xiàn)。動物在動物宿主細(xì)胞中,許多表達(dá)系統(tǒng)可利用。就使用腺病毒作為表達(dá)載體而言,本發(fā)明的多核苷酸序列可與腺病毒轉(zhuǎn)錄/翻譯控制復(fù)合物,如晚期啟動子和三聯(lián)前導(dǎo)序列連接。然后可將該嵌合的基因通過體外或體內(nèi)重組插入腺病毒基因組。在該病毒基因組的非必需區(qū)(如E1或E3區(qū))插入將得到活的重組病毒,它能在感染的宿主中表達(dá)該編碼的多肽(見例如Logan&Shenk,Proc.Natl.Acad.Sci.USA813655-3659(1984))。另外,亦可使用痘苗病毒7.5K啟動子。(見例如Mackett等(1982)Proc.Natl.Acad.Sci.USA797415-7419;Mackett等(1982)J.Virol.49857-864;和Panicali等(1982)Proc.Natl.Acad.Sci.USA794927-4931)。哺乳動物宿主細(xì)胞中優(yōu)選的表達(dá)系統(tǒng)是西門利克森林病毒(SemlikiForestviras)。哺乳動物宿主細(xì)胞,例如幼倉鼠腎(BHK)細(xì)胞和中國倉鼠卵巢(CHO)細(xì)胞的感染可得到非常高的重組表達(dá)水平。西門利克森林病毒是優(yōu)選的表達(dá)系統(tǒng),因?yàn)樵摬《揪哂袕V泛的宿主范圍,使得哺乳動物細(xì)胞系的感染成為可能。更具體的,預(yù)計西門利克森林病毒可用于各式各樣的宿主,因?yàn)樵撓到y(tǒng)不基于染色體整合,因此將是在針對鑒定結(jié)構(gòu)-功能關(guān)系和測試各種雜交分子的效果的研究中獲得重組動物膠原修飾的快速途徑。例如在Olkkonen等(1994)MethodsCellBiol4343-53中描述了構(gòu)建用于在哺乳動物宿主細(xì)胞中表達(dá)外源蛋白質(zhì)的西門利克森林病毒載體的方法。還可用轉(zhuǎn)基因動物表達(dá)本發(fā)明的多肽。可通過將本發(fā)明的多肽與啟動子,以及單獨(dú)與其它所需或可任選的能在哺乳動物腺體中有效表達(dá)的調(diào)控序列可操縱性連接,構(gòu)建該系統(tǒng)。類似的,可同時在靶細(xì)胞中用合適的表達(dá)系統(tǒng)產(chǎn)生所需或可任選的翻譯后酶。用轉(zhuǎn)基因動物重組產(chǎn)生蛋白質(zhì)的方法是本領(lǐng)域已知的(見例如美國專利號4,736,866;美國專利號5,824,838;美國專利號5,487,992;和美國專利號5,614,396)。膠原和明膠的用途本發(fā)明的重組膠原和明膠用于各種用途。膠原廣泛用于醫(yī)學(xué)、藥學(xué)、食品和化妝品工業(yè)的許多用途。例如,膠原是人工密封膠、骨移植物、藥物釋放系統(tǒng)、皮膚移植、止血劑和失禁植入體的重要成分。在自身免疫疾病,例如類風(fēng)濕性關(guān)節(jié)炎的治療中,在試驗(yàn)中評價了膠原誘導(dǎo)口服耐受的性能。膠原還用于食品,例如腸衣和其它衍生自例如豬、牛和羊來源的膠原基衣。在健康和美容應(yīng)用中,可在例如化妝品或面部和皮膚產(chǎn)品,如保濕霜中找到膠原。迄今,用于各種用途的各種膠原是用酶和化學(xué)方法衍生自動物來源的。例如,市售的牛膠原分離自牛組織和骨骼,主要由I型和III型膠原的混合物構(gòu)成。該膠原形式也用作人的注射裝置。明膠出現(xiàn)在各種藥物或醫(yī)學(xué)產(chǎn)品和裝置,包括藥物穩(wěn)定劑,例如藥物和疫苗、血漿補(bǔ)充劑、海綿、硬和軟明膠膠囊、栓劑等的成品中,或作為其中的成分。在特別設(shè)計用于藥物口服固態(tài)劑型,包括控釋膠囊和片劑的各種薄膜包裝系統(tǒng)中,利用明膠的薄膜形成性。在食品和飲料工業(yè)中長期使用各種可食形式的明膠。明膠在各種人造稠黃油(whippedtoppings)和湯和調(diào)味汁中作為乳化劑和增稠劑。明膠可用作澄清劑,澄清各種飲料,包括葡萄酒和果汁。明膠亦可在各種低脂或減低脂肪產(chǎn)品生產(chǎn)中用作增稠劑和穩(wěn)定劑,亦可作為脂肪替代品出現(xiàn)。明膠還廣泛用于調(diào)味劑、色素和維生素的微囊化。明膠還可在各種高能和營養(yǎng)飲料和食品(例如那些在減肥和體育運(yùn)動產(chǎn)業(yè)中流行的)中用作蛋白質(zhì)補(bǔ)充物。作為薄膜形成物,明膠用于對水果,肉類、熟食包衣,和各種糖果制品,包括硬糖和口香糖等。在化妝品工業(yè)中,明膠出現(xiàn)在各種護(hù)發(fā)和護(hù)膚品中。明膠在許多洗發(fā)精、摩絲、霜、乳液、面膜、唇膏、指甲油和產(chǎn)品,和其它美容裝置和用途中用作增稠劑和基礎(chǔ)劑。明膠還在化妝品工業(yè)中用于微囊化和包裝各種產(chǎn)品。明膠用于各式各樣的工業(yè)用途。例如,明膠在各種制造過程中廣泛用作膠水和粘合劑。明膠可用于各種粘合劑和膠水制劑,例如用于制造可重新水化的膠紙包裝帶、木膠貼、各級紙板箱和紙的紙面粘合,和各種提供可在重新濕潤后重新活化的粘性表面的應(yīng)用。明膠在各種電子裝置中作為光敏感性涂層,在各種光刻(photoliphographic)法中作為光敏電阻(photoresist)基底,例如在彩色電視機(jī)和攝像機(jī)制造中。在半導(dǎo)體制造中,用明膠構(gòu)建引線框和各種半導(dǎo)體元件的包被。明膠可用于印刷過程和制造特殊質(zhì)量的紙,例如用于債券和股票證明等。明膠用于各種照像用途,例如作為照像溶液中的各種活性成分的攜帶者,包括用于X光和照像膠片顯影的溶液。長期用于各種照像凸板制版法的明膠也作為各種類型膠片的成分,并大量用于各種膠片層和紙制品的鹵化銀化學(xué)。銀明膠膠片是縮微膠片形式和其它信息儲藏形式。用明膠作為各種膠片膜的自密封元件等。明膠還是用于各種實(shí)驗(yàn)室用途的有價值物質(zhì)。例如,明膠可用于各種細(xì)胞培養(yǎng)用途,提供細(xì)胞附著和生長的合適表面,例如培養(yǎng)皿和培養(yǎng)瓶,或提供細(xì)胞附著和生長的表面。水解或低凝膠強(qiáng)度的明膠可用作各種試驗(yàn)的生物緩沖劑,例如在諸如酶聯(lián)免疫吸附試驗(yàn)(ELISA)和其它免疫試驗(yàn)的包被和封閉溶液。明膠還在各種用于生物化學(xué)和電泳分析的凝膠,包括酶顯影凝膠(enzymographygels)中作為組分。實(shí)施例提供下列實(shí)施例僅為了說明所要求的發(fā)明。然而本發(fā)明不限于舉例的實(shí)施例的范圍,它們僅是為了說明本發(fā)明的一個方面,功能性相等的方法在本發(fā)明的范圍內(nèi)。事實(shí)上,除了本文所述的外本發(fā)明的各種修飾對于本領(lǐng)域技術(shù)人員從上述內(nèi)容和附圖將變得明白。這些修改應(yīng)在所附權(quán)利要求的范圍內(nèi)。實(shí)施例1牛前膠原I型α1的測序進(jìn)行了實(shí)驗(yàn),通過PCR從商品牛主動脈平滑肌cDNA文庫(Stratagene#936705)來產(chǎn)+生α1(I)膠原基因片段,它是最初PCR實(shí)驗(yàn)中牛膠原(I)α2基因片段的最成功來源。在該最初的篩選過程中,從牛mRNA序列設(shè)計膠原(I)α2的PCR引物(Shirai等(1998)MatrixBiology1785-88),進(jìn)行PCR擴(kuò)增,獲得DNA片段。雖然顯示商品文庫含有牛膠原(I)α2基因的整個編碼區(qū),用各種人α1(I)膠原序列PCR引物產(chǎn)生牛α1(I)膠原基因的嘗試證明是不成功的。尋找一種類似含有牛α1(I)膠原轉(zhuǎn)錄物的cDNA庫的另選來源。ATCC牛皮膚細(xì)胞系(CRL-6054;皮膚,正常,牛)生長到約60%匯合,分離總RNA(QiagenRNeasy)。從得到的RNA通過RT-PCR(ClontechRT-for-PCR試劑)制備cDNA庫。用該cDNA庫作為模板序列,用于隨后重疊基因片段的PCR實(shí)驗(yàn)。從已知的人α1(I)膠原mRNA序列設(shè)計引物,用于擴(kuò)增該基因開放閱讀框的重疊區(qū)段(Mackay等(1993)HumanMolecularGenetics2(8)1155-1160)。PCR引物經(jīng)過工程改造,用于擴(kuò)增位于人α1(I)膠原基因的三鏈螺旋編碼區(qū)中的片段,并列于表1。表1用引物獲得覆蓋牛α1(I)膠原基因的三鏈螺旋部分的重疊牛PCR片段。用熱循環(huán)儀(Hybaid,非冷凍)在下列條件下進(jìn)行PCR(Clontech,AdvantageGC-RichcDNAPCR試劑盒;全部PCR引物在每次反應(yīng)中使用100皮摩爾(pmol))步驟194℃4分鐘步驟228循環(huán)68℃3分鐘94℃30秒60℃30秒步驟368℃10分鐘30℃1秒維持在室溫最初全部PCR產(chǎn)物用凝膠電泳篩選,可預(yù)測大小的用瓊脂糖凝膠電泳和/或柱層析純化(QiagenQiaquick)。為了方便測序,將所選的PCR片段克隆入載體(pCRII-TOPO試劑盒,Invitrogen)。用外部載體測序引物(M13正向和反向)用ABI373自動測序儀(ABIPRISMBigDyeTM終止循環(huán)測序試劑盒,Perkin-Elmer)對各PCR片段的多個克隆進(jìn)行測序。獲得的序列資料用SEQMAN軟件(DNASTAR)分析,確定克隆片段的共有序列。用獲得的牛α1(I)膠原序列設(shè)計內(nèi)部牛膠原測序引物,然后用于對這些??寺⊥暾麥y序。這些引物是在引物設(shè)計軟件(RightPrimer,BioDisk)的幫助下設(shè)計的,列于表2。表2在用表1(SEQIDNO13-20)的8個SSCP人引物產(chǎn)生牛PCR產(chǎn)物后,擴(kuò)增三條另外的PCR片段,與最初的牛克隆重疊,衍生到ORF推定的末端(通過用人α1(I)膠原序列模似)。用于該擴(kuò)增的PCR引物列于表3。表3克隆并對得到的DNA片段進(jìn)行測序,對于基因ORF的大部分通過配對下列引物HAVRII(SEQIDNO43)和SSCP1REV(SEQIDNO14);HEAR1F(SEQIDNO44)和HNOT1REV(SEQIDNO45);和SSCP4F(SEQIDNO19)和HNOT1REV(SEQIDNO45)建立了共有序列。為了獲得cDNA克隆的5’和3’末端,從牛序列通過RACE(快速擴(kuò)增cDNA末端)法(SMARTRACEcDNA擴(kuò)增試劑盒,Clontech)和引物設(shè)計軟件的幫助設(shè)計嵌套PCR引物。為了提高專一性,設(shè)計具有特別的高解鏈溫度的引物。該設(shè)計的引物列于表4。表4上述總牛mRNA進(jìn)一步用于制備具有用作PCR模板的帶有該必需外部引物位點(diǎn)的新cDNA庫。用(1)著落(touchdown)PCR技術(shù);(2)新設(shè)計的牛RACEPCR引物;和(3)試劑盒中提供的材料在基因的5’和3’端兩處獲得了PCR產(chǎn)物。在Peltier-冷卻的熱循環(huán)儀中用下列方案和條件使用兩個著落PCR程序72℃-68℃著落程序I步驟1具有下列條件的8個循環(huán)94℃10秒鐘72℃10秒鐘,每循環(huán)下降0.5℃72℃3分鐘步驟2具有下列條件的28個循環(huán)94℃10秒鐘68℃10秒鐘72℃3分鐘72℃10分鐘4℃保持68℃-64℃著落程序II步驟1具有下列條件的8個循環(huán)94℃10秒鐘68℃10秒鐘,每循環(huán)下降0.5℃72℃3分鐘步驟2具有下列條件的28個循環(huán)94℃10秒鐘68℃10秒鐘72℃3分鐘72℃10分鐘4℃保持用1.2%瓊脂糖凝膠電泳檢測得到的片段,隨后進(jìn)行克隆和測序分析。用來自兩個程序的PCR產(chǎn)物。該得到的序列與先前克隆的牛α1(I)膠原序列,以及編碼的ORF5’和3’末端,以及連續(xù)非翻譯cDNA區(qū)重疊。牛原膠原I型α1的核苷酸序列如圖1A-1C所示(SEQIDNO1)。對應(yīng)的氨基酸如圖2A-2D所示(SEQIDNO2)。如圖13A-13I所示,翻譯的牛膠原ORF序列與已知人(HU)、小鼠(MUS)、犬(CANIS)、牛蛙(RANA)和日本水螈(CYNPS)序列對齊。翻譯的牛序列還和已公開的牛α1(I)膠原的三鏈螺旋重復(fù)域的氨基酸序列片段對齊。(見例如Miller(1984)ExtracellularMatrixBiochemistry,Piez等編,ElsevierSciencePublishing,NewYork,pp.41-81;和SWISSPROT數(shù)據(jù)庫登錄號p02453)。注意到本發(fā)明提供的預(yù)測的牛α1(I)膠原蛋白質(zhì)序列和之前已知的牛蛋白質(zhì)序列之間有許多差異。這些差異中的一些包括通常難于被蛋白質(zhì)測序辨別的氨基酸取代(例如谷氨酰胺/谷氨酸和天冬氨酸/天冬酰胺)。本文公開的如SEQIDNO1的多核苷酸序列提示這些已知的牛α1(I)膠原蛋白序列可含有錯誤,因此可以,例如排除,不用于通過氨基酸回翻譯(backtranslation)構(gòu)建編碼可靠的牛α1(I)膠原的合成基因。實(shí)施例2牛前膠原III型α1的測序如下分離了牛前膠原III型α1cDNA。用1微升牛肝PolyA+RNA(Clontech,目錄號6810-1),用AmbionRetroscript試劑盒(目錄號1710)按如下步驟通過逆轉(zhuǎn)錄反應(yīng)構(gòu)建cDNA鏈1微升RNA(1微克)4微升dNTPs混合物(各2.5mM)2微升OligodT第一鏈引物9微升無菌水該溶液在75℃保溫3分鐘,然后置于冰上。然后加入下列2微升10X另外的RT-PCR緩沖液1微升胎盤RNAase抑制劑1微升M-MLV逆轉(zhuǎn)錄酶反應(yīng)在42℃進(jìn)行90分鐘,然后在92℃保溫10分鐘滅活。然后將反應(yīng)物儲藏在-20℃。根據(jù)人前膠原3型α1cDNA(GenBank登錄號X14420)和牛前膠原3型α1cDNA(Genbank登錄號L47641)的序列設(shè)計寡核苷酸引物。用上述制備的第一鏈cDNA和表5列出的引物進(jìn)行PCR。表5PCR反應(yīng)條件如下5微升上述逆轉(zhuǎn)錄酶反應(yīng)物5微升10X反應(yīng)緩沖液1.5微升dNTPs混合物(各2.5mM)1.5微升引物CIII-1(5μM)1.5微升引物CIII-6(5μM)0.5微升Platinumpfx聚合酶(LifeTech,目錄號11708-013)35微升無菌水50微升總體積反應(yīng)混合物在TechneGeniusDNA熱循環(huán)儀中如下循環(huán)80℃2分鐘94℃2分鐘1循環(huán)94℃30秒鐘55℃30秒鐘35循環(huán)68℃4.5分鐘68℃5分鐘1循環(huán)在反應(yīng)物中用引物CIII-1(SEQIDNO54)和CIII-6(SEQIDNO55)鑒定約4500bp的DNA條帶。用QiagenQiaQuick凝膠提取試劑盒(目錄號28704)純化該DNA片段,并連接到質(zhì)粒載體pCR-Blunt(InvitrogenZeroBluntTMPCR克隆試劑盒,目錄號K2700-20)。得到的重組質(zhì)粒引入完整的大腸桿菌(JM109),用QiagenQiaprepSpinMiniprep試劑盒(目錄號27106)產(chǎn)生重組質(zhì)粒DNA的原種。在LI-COR4200自動熒光測序儀(MWG-BiotechUKLtd.)上測序DNA。在可從如Genbank登錄號L47641和PO4258(僅氨基酸)所述的部分牛序列獲得高質(zhì)量序列的區(qū)域,顯示本發(fā)明牛α1(III)cDNA序列是同源的。在其它區(qū)域,鑒定出與人前膠原α1(III)cDNA(Genbank登錄號X14420)和豬前膠原α1(III)cDNA(Genbank登錄號C94995、C94535和C94565)高度同源的序列。因?yàn)?’引物CIII-1(SEQIDNO54)是對應(yīng)人序列設(shè)計的,因此整合到新分離的cDNA中,在該區(qū)域中如下鑒定該天然牛序列。從牛cDNA中用引物A3-N(SEQIDNO56)和CIII-4(SEQIDNO57)擴(kuò)增約3700bp的另一條PCR片段。根據(jù)人前膠原3型α1cDNA的序列在緊挨起始密碼子的立即上游區(qū)設(shè)計引物。對得到的片段進(jìn)行測序并用引物CIII-1(SEQIDNO54)和CIII-6(SEQIDNO6)確認(rèn)??偟恼f,用RT-PCR從牛mRNA分離牛前膠原α1(III)的全長cDNA。在用表5所述的引物和用實(shí)施例1中所述和本領(lǐng)域技術(shù)人員已知的方法設(shè)計的測序引物全面測序(三次獨(dú)立的PCR反應(yīng))后,裝配含有起始密碼子ATG和終止密碼子TAA的4428bp的鄰接序列(圖3A-3C,SEQIDNO3)。圖4A-4D顯示了推測的氨基酸序列(SEQIDNO4)。獲得了兩條牛α1(III)膠原的cDNA序列變體(SEQIDNO3和SEQIDNO5),通過多克隆測序確定。SEQIDNO3和對應(yīng)的氨基酸序列(SEQIDNO4)對應(yīng)于Genbank登錄號L47641中的合適區(qū)域。比較起來,SEQIDNO5(圖5A-5C)顯示C-T的堿基取代,導(dǎo)致密碼子從AAC變?yōu)锳AT(都編碼Asp);一個A-G的堿基取代,導(dǎo)致密碼子從AAT變?yōu)镚AT(殘基1232處的Asp-Asn取代);和T-C堿基取代,導(dǎo)致密碼子從GTC變?yōu)镚CC(殘基1382的Val-Ala取代)。圖6A-6D顯示相應(yīng)的推測氨基酸序列(SEQIDNO6)。上述序列與可得的部分牛序列相同(Genbank登錄號L47641和PO4258)。實(shí)施例3豬前膠原1型α1的測序用如下方法分離豬前膠原I型α1cDNA。將冷凍的豬肝(從AngloDutchMeats,Charing,Kent獲得)置于液氮中,用杵和臼研磨。將約800毫克粉碎的物質(zhì)加到5毫升AmbionRNAqeous試劑盒(目錄號1912)所述的裂解結(jié)合溶液中。Dounce勻漿后,用離心(12,000xg,2分鐘)除去任何碎片,在勻漿液中加入另外5毫升裂解結(jié)合溶液。加入10微升64%乙醇,混合,并在RNAqeous濾器(Ambion)中加入裂解液/乙醇混合物。用2x700微升裂解液/乙醇混合物加載各濾器,離心(12,000xg,1分鐘)。然后用700微升洗滌溶液1號(Ambion)洗滌濾器一次,用500微升洗滌溶液2/3號(Ambion)洗滌兩次,在每次洗滌步驟后離心,在最后洗滌后最終離心一次(12,000xg,15秒)。通過加入2x60微升預(yù)熱(95℃)洗脫溶液(Ambion)將RNA從濾器洗脫到濾器中央,并離心(12,000xg,室溫,30秒鐘)。合并4次純化RNA的4個洗脫液(總濃度~15微克),用0.5×體積的氯化鋰(Ambion)-20℃沉淀過夜。然后在12,000xg,15分鐘,4℃離心,用70%乙醇洗滌沉淀。然后空氣干燥沉淀并重新懸浮在15微升無菌水中,并儲藏在-70℃。用1微升上述分離的RNA,用實(shí)施例2所述進(jìn)行的逆轉(zhuǎn)錄反應(yīng)構(gòu)建cDNA鏈。設(shè)計了基于人前膠原α1(I)cDNA(Genbank登錄號NM000088)序列和豬前膠原α1(I)cDNA(Genbank登錄號C94935)的寡核苷酸引物。然后用實(shí)施例2所述的方法進(jìn)行PCR,制備的第一鏈cDNA和對應(yīng)已知的人或豬DNA引物(表6)。表6對豬肝純化的RNA進(jìn)行逆轉(zhuǎn)錄PCR,在該反應(yīng)中用引物HUI-5(SEQIDNO61)和PCA1-6(SEQIDNO62)鑒定出約4500bp的DNA條帶。純化該DNA條帶,克隆并如實(shí)施例2中進(jìn)行測序。由于根據(jù)人序列設(shè)計了5’引物HUI-5(SEQIDNO61),從而整合入如上所述新分離的cDNA,在該區(qū)域需要被確認(rèn)的該天然豬序列。隨后從豬cDNA用引物A1-N(SEQIDNO63)和PCAI-4(SEQIDNO64)擴(kuò)增約750bp的額外PCR片段。根據(jù)在人前膠原α1(I)cDNA起始密碼子立即上游區(qū)域的序列設(shè)計引物A1-N(SEQIDNO63)。對該片段進(jìn)行測序,確認(rèn)用引物HU1-5(SEQIDNO61)和PCA1-6(SEQIDNO62)產(chǎn)生的全長豬α1(I)cDNA片段具有真正的5’末端,而不是引入了基于人序列的引物的雜交序列??偟恼f,用豬肝的RT-PCR分離了豬前膠原α1(I)的全長cDNA。全面測序(三個獨(dú)立的PCR反應(yīng))后,如圖7A-7C中所示裝配了含有起始密碼子ATG和終止密碼子TAA的4425bp的連續(xù)序列(SEQIDNO7)。該序列與可得的部分豬序列(Genbank登錄號C94935和AU058670)相同,該序列顯示與人前膠原1型α1序列(登錄號G4502944)高度的同源性。豬1型α1膠原的相應(yīng)基酸序列顯示于圖8A-8D(SEQIDNO8)實(shí)施例4豬前膠原I型α2的測序用如下方法分離豬前膠原I型α2cDNA。主要如實(shí)施例2中所述進(jìn)行總RNA分離、逆轉(zhuǎn)錄和PCR。設(shè)計了基于人原膠原α2(I)前膠原(Genbank登錄號NM000089)和豬前膠原α2(I)cDNA(Genbank登錄號AU058497)序列的寡核苷酸引物。所用的引物列于表7。表7用下列引物對來產(chǎn)生三條具有下列大小的重疊片段1054bpDNA,用引物HU2-5(SEQIDNO66)和引物PCA2-6(SEQIDNO67);1766bpDNA,用引物PCA2-5(SEQIDNO68)和引物PCA2-8(SEQIDNO69);和1937bpDNA,用引物PCA2-7(SEQIDNO70)和引物PCA2-2(SEQIDNO71)。分離這些DNA片段,用上述方法亞克隆并測序。鑒定了與全長人具有α2(I)基因(Genbank登錄號NM000089)或部分豬α2(I)序列(Genbank登錄號AU058497)高度同源的序列。由于用對人序列設(shè)計了用于克隆豬前膠原1型α2cDNA的5’引物HU2-5(SEQIDNO66),從而整合入如上所述新分離的cDNA,用引物A2-N(SEQIDNO72)和PCA2-6(SEQIDNO67)隨后從豬cDNA中擴(kuò)增約1100bp的額外PCR片段。根據(jù)在人(Genbank登錄號NM000089)和牛(Genbank登錄號AB008683)前膠原α2(I)cDNA起始密碼子立即上游區(qū)域的序列設(shè)計引物A2-N。該DNA片段的序列確認(rèn)用引物HU2-5和PCA2-2產(chǎn)生的全長片段具有真正的豬5’末端。圖9A-9C顯示了豬α2(I)膠原基因(SEQIDNO9)的全長核苷酸序列。圖10A-10C描述了相應(yīng)的氨基酸序列(SEQIDNO10)。實(shí)施例5豬前膠原III型α1的測序用下列方法分離豬前膠原III型α1cDNA。從冷凍豬肝中分離總RNA,如實(shí)施例2中所述進(jìn)行逆轉(zhuǎn)錄和PCR。設(shè)計了基于人前膠原3型α1cDNA(Genbank登錄號X14420)和豬前膠原3型α1cDNA(Genbank登錄號C94995、C94535和C94565)的序列的寡核苷酸引物。這些引物列于上述表5。用從豬肝純化的RNA進(jìn)行RT-PCR,在反應(yīng)中用引物CIII-1(SEQIDNO54)和CIII-6(SEQIDNO55)鑒定了約4500bp的DNA條帶。純化該DNA片段,如上亞克隆和測序。在能從Genbank登錄號C94565、C94535和C95995的部分豬序列可得高質(zhì)量序列的區(qū)域,新cDNA的序列顯示是相同的。在其它區(qū)域鑒定了與人前膠原α1(III)cDNA(Genbank登錄號X14420)和牛前膠原α1(III)cDNA(衍生自本發(fā)明和Genbank登錄號L47641的序列)高度同源的序列。由于用對人序列設(shè)計了5′引物CIII-1,并整合到新分離的cDNA中,需要確定天然豬序列。用引物A3-N(SEQIDNO56)和CIII-4(SEQIDNO57)從豬cDNA擴(kuò)增了約3700bp的另一條PCR片段。根據(jù)起始密碼子立即上游區(qū)的人前膠原α1(III)cDNA序列設(shè)計了引物A3-N。對該片段進(jìn)行測序,確定了用引物CIII-1和CIII-6產(chǎn)生的全長片段具有真正的豬5′序列。總的說,用RT-PCR從豬肝中分離了豬α1(III)的全長cDNA。在全面測序后(三次獨(dú)立的PCR反應(yīng)),裝配含有起始密碼子ATG和終止密碼子TAA的4428bp的連續(xù)序列。(圖11A-11C,SEQIDNO11)。該序列與可得的部分豬序列(Genbank登錄號C94565、C94535和C95995)相同。整條序列顯示與人α1(III)前膠原cDNA(Genbank登錄號X14420)和牛α1(III)前膠原cDNA(來自本發(fā)明和Genbank登錄號L47641和PO4258)高度同源。豬III型α1膠原的推測氨基酸序列列于圖12A-12C(SEQIDNO12)。實(shí)施例6在轉(zhuǎn)基因植物中產(chǎn)生動物膠原和明膠將編碼本發(fā)明的動物膠原,脯氨酰4-羥化酶的α亞基和脯氨酰4-羥化酶的β亞基的cDNA克隆入合適的植物表達(dá)載體,該載體含有正確表達(dá)外源蛋白的必需元件。這些元件可以包括例如信號肽、啟動子和終止子(見例如Rogers等,見上;Schardl等,見上;Berger等,見上)。例如,本領(lǐng)域描述了pVL載體(見例如A.Lamberg等(1996)J.Biol.Chem.27111988-11995)。這些重組pVL載體用作用本領(lǐng)域已知的常規(guī)方法構(gòu)建植物表達(dá)載體的基因來源。為了在植物或植物細(xì)胞中表達(dá)膠原,可操縱性連接核酸序列,例如與CaMV35S啟動子連接。編碼脯氨酰4-羥化酶的α亞基或β亞基的核酸序列與CaMV35S啟動子可操縱性連接,并可以在相同或不同質(zhì)粒上存在以產(chǎn)生生物活性的脯氨酰4-羥化酶。用本領(lǐng)域熟知的轉(zhuǎn)化技術(shù)將表達(dá)載體轉(zhuǎn)化入植物或植物細(xì)胞。用例如RNA和蛋白質(zhì)印跡選擇表達(dá)克隆,并可在發(fā)酵罐中培養(yǎng),產(chǎn)生純化重組膠原的細(xì)胞團(tuán)塊。用300毫克細(xì)胞沉淀抽提物在10mMTris,pH7.8、100mMNaCl、100mM甘氨酸、10μM二硫蘇糖醇(DTT)、0.1%TritonX100、2μM亮抑酶肽(Leupeptin)和0.25mM苯甲基磺酰氟(PMSF)通過免疫印跡法等篩選脯氨酰4-羥化酶的α亞基和β亞基和動物膠原的表達(dá)。用4-20%SDS-PAGE分離提取物中的蛋白質(zhì),轉(zhuǎn)移到硝酸纖維素膜上,用針對脯氨酰4-羥化酶的α亞基和β亞基和動物膠原的抗體探測。為了確定植物或植物細(xì)胞中的重組動物膠原特征,進(jìn)行了下列方案1.在1MNaCl、0.05MTris,pH7.4中懸浮并勻化細(xì)胞沉淀,4℃攪拌1小時。4℃離心收集上清液;2.在上清液中加入7.5毫升乙酸,4℃培養(yǎng)2小時。4℃離心收集沉淀。3.用2MNaCl,0.05Mtris,pH7.4洗滌沉淀兩次;4.在2M脲、0.2MNaCl、0.05MTris,pH7.4中重新溶解;5.對2M脲、0.2MNaCl、0.05MTris,pH7.4透析;6.通過DEAE-纖維素柱。收集流出液;7.加入乙酸達(dá)0.5M,加入NaCl達(dá)0.9M,4℃培養(yǎng)2小時;8.離心收集沉淀;9.將沉淀重新懸浮在0.5M乙酸中,在4℃攪拌過夜。10.用0.1mg/ml胃蛋白酶消化沉淀2小時;11.加入飽和Tris緩沖液,將pH調(diào)節(jié)到7.4;12.過夜培養(yǎng),滅活胃蛋白酶;13.加入NaCl達(dá)0.9M,乙酸達(dá)0.5M,4℃培育2小時;14.4℃離心收集沉淀;15.用2MNaCl、0.05MTris,pH7.4洗滌沉淀;16.溶于2M脲、150MNaCl、0.05MTris,pH7.4;和17.樣品在56℃加熱5分鐘,然后加到用高效液相層析(HPLC)系統(tǒng)操作的Bio-GelTSK40柱上。用氨基酸組分分析確定得到的純化膠原的特征。本發(fā)明所述方法和系統(tǒng)的各種修改和變化對于本領(lǐng)域技術(shù)人員是明白的,不違背本發(fā)明的范圍和精神。雖然本發(fā)明結(jié)合特別的優(yōu)選例進(jìn)行了描述,應(yīng)理解所要求的本發(fā)明不會不恰當(dāng)?shù)谋贿@些具體實(shí)施例所限。事實(shí)上,對于分子生物學(xué)或相關(guān)領(lǐng)域的技術(shù)人員來說明顯易見的所述實(shí)施本發(fā)明的模式的各種修改是在權(quán)利要求的范圍內(nèi)。本文引用的全部文獻(xiàn)在此完整引入以供參考。序列表<110>法布羅根股份有限公司(FIBROGEN,INC.)<120>動物膠原和明膠<130>FG0217PCT<140><141><160>72<170>PatentInVer.2.0<210>1<211>4748<212>DNA<213>牛(bostaurus)<400>1cagacgggagtttctcctcggggtcggagcaggaggcacgcggagtgtgaggccacgcat60gagcggacgctaacccccaccccagccgcaaagagtctacatgtctagggtctagacatg120ttcagctttgtggacctccggctcctgctcctcttagcggccaccgccctcctgacgcac180ggccaagaggagggccaggaagaaggccaagaagaagacatcccaccagtcacctgcgta240cagaacggcctcaggtaccatgaccgagacgtgtggaaacccgtgccctgccagatctgt300gtctgcgacaacggcaacgtgctgtgcgatgacgtgatctgcgacgaacttaaggactgt360cctaacgccaaagtccccacggacgaatgctgccccgtctgccccgaaggccaggaatca420cccacggaccaagaaaccaccggagtcgagggaccgaaaggagacactggcccccgaggc480ccaaggggacccgccggcccccccggccgagatggcatccctggacaacctggacttccc540ggaccccctggaccccccggacctcccggaccccctggcctcggaggaaactttgctccc600cagttgtcttacggctatgatgagaaatcaacaggaatttccgtgcctggtcccatgggt660ccttctggtcctcgtggtctccctggcccccctggcgcacctggtccccaaggtttccaa720ggcccccctggtgagcctggcgagccaggagcctcaggtcccatgggtccccgtggtccc780cctggcccccctggcaagaacggagatgatggcgaagctggaaagcctggtcgtcctggt840gagcgcgggcctcccggacctcagggtgctcggggattgcctggaacagctggcctccct900ggaatgaagggacacagaggtttcagtggtttggatggtgccaagggagatgctggtcct960gctggccccaagggcgagcctggtagccccggtgaaaatggagctcctggtcagatgggc1020ccccgtggtctgcctggtgagagaggtcgccctggagcccctggccctgctggtgctcga1080ggaaatgatggtgcgactggtgctgctgggccccctggtcccactggccccgctggtcct1140cctggtttccctggtgctgtgggtgctaagggtgaaggtggtccccaaggaccccgaggt1200tctgaaggtccccagggtgtacgtggtgagcctggcccccctggccctgctggtgctgct1260ggccctgctggcaaccctggtgctgatggacagcctggtgctaaaggagccaatggcgct1320cctggtattgctggtgctcctggcttccctggtgcccgaggcccctctggaccccagggc1380cccagcggcccccctggccccaagggtaacagcggtgaacctggtgctcctggcagcaaa1440ggagacactggcgccaagggagaacccggtcccactggtattcaaggcccccctggcccc1500gctggggaagaaggaaagcgaggagcccgaggtgaacctggacctgctggcctgcctgga1560ccccctggcgagcgtggtggacctggaagccgtggtttccctggcgccgacggtgttgct1620ggtcccaagggtcctgctggtgaacgcggtgctcctggccctgctggccccaaaggttct1680cctggtgaagctggtcgccccggtgaagctggtctgcccggtgccaagggtctgactgga1740agccctggcagcccgggtcctgatggcaaaactggcccccctggtcccgccggtcaagat1800ggccgccctggacctccaggccctcccggtgcccgtggtcaggctggcgtgatgggtttc1860cctggacctaaaggtgctgctggagagcctggaaaagctggagagcgaggtgttcctgga1920ccccctggcgctgttggtcctgctggcaaagacggagaagctggagctcagggaccccca1980ggacctgctggcccgctggtgagagaggcgaacaaggccctgctggctcccctggattcc2040agggtctccccggccctgctggtcctcctggtgaagcaggcaaacctggtgaacagggtg2100ttcctggagatcttggtgcccccggcccctctggagcaagaggcgagagaggtttccccg2160gcgagcgtggtgtgcaagggccgcccggtcctgcaggtccccgtggggccaatggtgccc2220ctggcaacgatggtgctaagggtgatgctggtgcccctggagcccccggtagccagggtg2280cccctggccttcaaggaatgcctggtgaacgaggtgcagctggtcttccaggccctaagg2340gtgacagaggggatgctggtcccaaaggtgctgatggtgctcctggcaaagatggcgtcc2400gtggtctgactggtcccatcggtcctcctggccccgctggtgcccctggtgacaagggtg2460aagctggtcctagcggcccagccggtcccactggagctcgtggtgcccccggtgaccgtg2520gtgagcctggtccccccggccctgctggcttcgctggcccccctggtgctgatggccaac2580ctggtgctaaaggcgaacctggtgatgctggtgctaaaggtgacgctggtccccccggcc2640ctgctgggcccgctggaccccccggccccattggtaacgttggtgctcccggacccaaag2700gtgctcgtggcagcgctggtccccctggtgctactggtttcccaggtgctgctggccgag2760ttggtccccccggcccctctggaaatgctggaccccctggccctcctggccctgctggca2820aagaaggcagcaaaggcccccgcggtgagactggccccgctgggcgtcccggtgaagtcg2880gtccccctggtccccctggccccgctggtgagaaaggagcccctggtgctgacggacctg2940ctggagctcctggcactcctggacctcaaggtattgctggacagcgtggtgtggtcggcc3000tgcctggtcagagaggagaaagaggcttccctggtcttcctggcccctctggtgaacccg3060gcaaacaaggtccttctggagcaagtggtgaacgtggcccccctggtcccatgggccccc3120ctggattggctggaccccctggcgagtctggacgtgagggagctcctggtgctgaaggat3180cccctggacgagatggttctcctggcgccaagggtgaccgtggtgagaccggccctgctg3240gacctcctggtgctcctggcgctcccggtgcccccggccctgtcggacctgccggcaaga3300gcggtgatcgtggtgagaccggtcctgctggtcctgctggtcccattggccccgttggtg3360cccgtggccccgctggaccccaaggcccccgtggtgacaagggtgagacaggcgaacagg3420gcgacagaggcattaagggtcaccgtggcttctctggtctccagggtccccccggccctc3480ccggctctcctggtgagcaaggtccttccggagcctctggtcctgctggtccccgcggtc3540cccctggctctgctggttctcccggcaaagatggactcaatggtctcccaggccccatcg3600gtccccctgggcctcgaggtcgcactggtgatgctggtcctgctggtcctcccggccctc3560ctggaccccctggtcccccaggtcctcccagcggcggctacgacttgagcttcctgcccc3720agccacctcaagagaaggctcacgatggtggccgctactaccgggctgatgatgccaatg3780tggtccgtgaccgtgacctcgaggtggacaccaccctcaagagcctgagccagcagatcg3840agaacatccggagccctgaaggcagccgcaagaaccccgcccgcacctgccgtgacctca3900agatgtgccactctgactggaagagcggagaatactggattgaccccaaccaaggctgca3960acctggatgccattaaggtcttctgcaacatggaaaccggtgagacctgtgtatacccca4020ctcagcccagcgtggcccagaagaactggtatatcagcaagaaccccaaggaaaagaggc4080acgtctggtacggcgagagcatgaccggcggattccagttcgagtatggcggccaggggt4140ccgatcctgccgatgtggccatccagctgactttcctgcgcctgatgtccaccgaggcct4200cccagaacatcacctaccactgcaagaacagcgtggcctacatggaccagcagactggca4260acctcaagaaggccctgctcctccagggctccaacgagatcgagatccgggccgagggca4320acagccgcttcacctacagcgtcacctacgatggctgcacgagtcacaccggagcctggg4380gcaagacagtgatcgaatacaaaaccaccaagacctcccgcttgcccatcatcgatgtgg4440cccccttggacgttggcgccccagaccaggaattcggtttcgacgttggccctgcctgct4500tcctgtaaactccttccaccccaacctggctccctcccacccaacccacttgcccctgac4560tctggaaacagacaaacaacccaaactgaaacccccgaaaagccaaaaaatgggagacaa4620tttcacatggactttggaaaatatttttttcctttgcattcatctctcaaacttagtttt4680tatctttgaccaactgaacatgaccaaaaaccaaaagtgcattcaaccttaccaaaaaaa4740aaaaaaaa4748<210>2<211>1463<212>PRT<213>牛(bostaurus)<400>2MetPheSerPheValAspLeuArgLeuLeuLeuLeuLeuAlaAlaThr151015AlaLeuLeuThrHisGlyGlnGluGluGlyGlnGluGluGlyGlnGlu202530GluAspIleProProValThrCysValGlnAsnGlyLeuArgTyrHis354045AspArgAspValTrpLysProValProCysGlnIleCysValCysAsp505560AsnGlyAsnValLeuCysAspAspValIleCysAspGluLeuLysAsp65707580CysProAsnAlaLysValProThrAspGluCysCysProValCysPro859095GluGlyGlnGluSerProThrAspGlnGluThrThrGlyValGluGly100105110ProLysGlyAspThrGlyProArgGlyProArgGlyProAlaGlyPro115120125ProGlyArgAspGlyIleProGlyGlnProGlyLeuProGlyProPro130135140GlyProProGlyProProGlyProProGlyLeuGlyGlyAsnPheAla145150155160ProGlnLeuSerTyrGlyTyrAspGluLysSerThrGlyIleSerVal165170175ProGlyProMetGlyProSerGlyProArgGlyLeuProGlyProPro180185190GlyAlaProGlyProGlnGlyPheGlnGlyProProGlyGluProGly195200205GluProGlyAlaSerGlyProMetGlyProArgGlyProProGlyPro210215220ProGlyLysAsnGlyAspAspGlyGluAlaGlyLysProGlyArgPro225230235240GlyGluArgGlyProProGlyProGlnGlyAlaArgGlyLeuProGly245250255ThrAlaGlyLeuProGlyMetLysGlyHisArgGlyPheSerGlyLeu260265270AspGlyAlaLysGlyAspAlaGlyProAlaGlyProLysGlyGluPro275280285GlySerProGlyGluAsnGlyAlaProGlyGlnMetGlyProArgGly290295300LeuProGlyGluArgGlyArgProGlyAlaProGlyProAlaGlyAla305310315320ArgGlyAsnAspGlyAlaThrGlyAlaAlaGlyProProGlyProThr325330335GlyProAlaGlyProProGlyPheProGlyAlaValGlyAlaLysGly340345350GluGlyGlyProGlnGlyProArgGlySerGluGlyProGlnGlyVal355360365ArgGlyGluProGlyProProGlyProAlaGlyAlaAlaGlyProAla370375380GlyAsnProGlyAlaAspGlyGlnProGlyAlaLysGlyAlaAsnGly385390395400AlaProGlyIleAlaGlyAlaProGlyPheProGlyAlaArgGlyPro405410415SerGlyProGlnGlyProSerGlyProProGlyProLysGlyAsnSer420425430GlyGluProGlyAlaProGlySerLysGlyAspThrGlyAlaLysGly435440445GluProGlyProThrGlyIleGlnGlyProProGlyProAlaGlyGlu450455460GluGlyLysArgGlyAlaArgGlyGluProGlyProAlaGlyLeuPro465470475480GlyProProGlyGluArgGlyGlyProGlySerArgGlyPheProGly485490495AlaAspGlyValAlaGlyProLysGlyProAlaGlyGluArgGlyAla500505510ProGlyProAlaGlyProLysGlySerProGlyGluAlaGlyArgPro515520525GlyGluAlaGlyLeuProGlyAlaLysGlyLeuThrGlySerProGly530535540SerProGlyProAspGlyLysThrGlyProProGlyProAlaGlyGln545550555560AspGlyArgProGlyProProGlyProProGlyAlaArgGlyGlnAla565570575GlyValMetGlyPheProGlyProLysGlyAlaAlaGlyGluProGly580585590LysAlaGlyGluArgGlyValProGlyProProGlyAlaValGlyPro595600605AlaGlyLysAspGlyGluAlaGlyAlaGlnGlyProProGlyProAla610615620GlyProAlaGlyGluArgGlyGluGlnGlyProAlaGlySerProGly625630635640PheGlnGlyLeuProGlyProAlaGlyProProGlyGluAlaGlyLys645650655ProGlyGluGlnGlyValProGlyAspLeuGlyAlaProGlyProSer660665670GlyAlaArgGlyGluArgGlyPheProGlyGluArgGlyValGlnGly675680685ProProGlyProAlaGlyProArgGlyAlaAsnGlyAlaProGlyAsn690695700AspGlyAlaLysGlyAspAlaGlyAlaProGlyAlaProGlySerGln705710715720GlyAlaProGlyLeuGlnGlyMetProGlyGluArgGlyAlaAlaGly725730735LeuProGlyProLysGlyAspArgGlyAspAlaGlyProLysGlyAla740745750AspGlyAlaProGlyLysAspGlyValArgGlyLeuThrGlyProIle755760765GlyProProGlyProAlaGlyAlaProGlyAspLysGlyGluAlaGly770775780ProSerGlyProAlaGlyProThrGlyAlaArgGlyAlaProGlyAsp785790795800ArgGlyGluProGlyProProGlyProAlaGlyPheAlaGlyProPro805810815GlyAlaAspGlyGlnProGlyAlaLysGlyGluProGlyAspAlaGly820825830AlaLysGlyAspAlaGlyProProGlyProAlaGlyProAlaGlyPro835840845ProGlyProIleGlyAsnValGlyAlaProGlyProLysGlyAlaArg850855860GlySerAlaGlyProProGlyAlaThrGlyPheProGlyAlaAlaGly865870875880ArgValGlyProProGlyProSerGlyAsnAlaGlyProProGlyPro885890895ProGlyProAlaGlyLysGluGlySerLysGlyProArgGlyGluThr900905910GlyProAlaGlyArgProGlyGluValGlyProProGlyProProGly915920925ProAlaGlyGluLysGlyAlaProGlyAlaAspGlyProAlaGlyAla930935940ProGlyThrProGlyProGlnGlyIleAlaGlyGlnArgGlyValVal945950955960GlyLeuProGlyGlnArgGlyGluArgGlyPheProGlyLeuProGly965970975ProSerGlyGluProGlyLysGlnGlyProSerGlyAlaSerGlyGlu980985990ArgGlyProProGlyProMetGlyProProGlyLeuAlaGlyProPro99510001005GlyGluSerGlyArgGluGlyAlaProGlyAlaGluGlySerProGly101010151020ArgAspGlySerProGlyAlaLysGlyAspArgGlyGluThrGlyPro1025103010351040AlaGlyProProGlyAlaProGlyAlaProGlyAlaProGlyProVal104510501055GlyProAlaGlyLysSerGlyAspArgGlyGluThrGlyProAlaGly106010651070ProAlaGlyProIleGlyProValGlyAlaArgGlyProAlaGlyPro107510801085GlnGlyProArgGlyAspLysGlyGluThrGlyGluGlnGlyAspArg109010951100GlyIleLysGlyHisArgGlyPheSerGlyLeuGlnGlyProProGly1105111011151120ProProGlySerProGlyGluGlnGlyProSerGlyAlaSerGlyPro112511301135AlaGlyProArgGlyProProGlySerAlaGlySerProGlyLysAsp114011451150GlyLeuAsnGlyLeuProGlyProIleGlyProProGlyProArgGly115511601165ArgThrGlyAspAlaGlyProAlaGlyProProGlyProProGlyPro117011751180ProGlyProProGlyProProSerGlyGlyTyrAspLeuSerPheLeu1185119011951200ProGlnProProGlnGluLysAlaHisAspGlyGlyArgTyrTyrArg120512101215AlaAspAspAlaAsnValValArgAspArgAspLeuGluValAspThr122012251230ThrLeuLysSerLeuSerGlnGlnIleGluAsnIleArgSerProGlu123512401245GlySerArgLysAsnProAlaArgThrCysArgAspLeuLysMetCys125012551260HisSerAspTrpLysSerGlyGluTyrTrpIleAspProAsnGlnGly1265127012751280CysAsnLeuAspAlaIleLysValPheCysAsnMetGluThrGlyGlu128512901295ThrCysValTyrProThrGlnProSerValAlaGlnLysAsnTrpTyr130013051310IleSerLysAsnProLysGluLysArgHisValTrpTyrGlyGluSer131513201325MetThrGlyGlyPheGlnPheGluTyrGlyGlyGlnGlySerAspPro133013351340AlaAspValAlaIleGlnLeuThrPheLeuArgLeuMetSerThrGlu1345135013551360AlaSerGlnAsnIleThrTyrHisCysLysAsnSerValAlaTyrMet136513701375AspGlnGlnThrGlyAsnLeuLysLysAlaLeuLeuLeuGlnGlySer138013851390AsnGluIleGluIleArgAlaGluGlyAsnSerArgPheThrTyrSer139514001405ValThrTyrAspGlyCysThrSerHisThrGlyAlaTrpGlyLysThr141014151420ValIleGluTyrLysThrThrLysThrSerArgLeuProIleIleAsp1425143014351440ValAlaProLeuAspValGlyAlaProAspGlnGluPheGlyPheAsp144514501455ValGlyProAlaCysPheLeu1460<210>3<211>4428<212>DNA<213>牛(bostaurus)<400>3gaattcagggacatgatgagctttgtgcaaaaggggacctggttacttttcgctctgctt60catcccactgttattttggcacaacaggaagctgttgacggaggatgctcccatctcggt120cagtcttatgcagatagagatgtatggaaaccagaaccgtgccaaatatgcgtctgtgac180tcaggatccgttctctgtgatgacataatatgtgacgaccaagaattagactgccccaac240cctgaaatcccgtttggagaatgttgtgcagtttgcccacagcctccaacagctcccact300cgccctcctaatggtcaaggacctcaaggccccaagggagatccaggtcctcctggtatt360cctgggcgaaatggcgatcctggtcctccaggatcaccaggctccccaggttctcccggc420cctcctggaatctgtgaatcatgtcctactggtggccagaactattctccccagtacgaa480gcatatgatgtcaagtctggagtagcaggaggaggaatcgcaggctatcctgggccagct540ggtcctcctggcccacccggaccccctggcacatctggccatcctggtgcccctggcgct600ccaggataccaaggtccccccggtgaacctgggcaagctggtccggcaggtcctccagga660cctcctggtgctataggtccatctggccctgctggaaaagatggggaatcaggaagaccc720ggacgacctggagagcgaggatttcctggccctcctggtatgaaaggcccagctggtatg780cctggattccctggtatgaaaggacacagaggctttgatggacgaaatggagagaaaggc840gaaactggtgctcctggattaaagggggaaaatggcgttccaggtgaaaatggagctcct900ggacccatgggtccaagaggggctcccggtgagagaggacggccaggacttcctggagcc960gcaggggctcgaggtaatgatggagctcgaggaagtgatggacaaccgggcccccctggt1020cctcctggaactgcaggattccctggttcccctggtgctaagggtgaagttggacctgca1080ggatctcctggttcaagtggcgcccctggacaaagaggagaacctggacctcagggacat1140gctggtgctccaggtccccctgggcctcctgggagtaatggtagtcctggtggcaaaggt1200gaaatgggtcctgctggcattcctggggctcctgggctgataggagctcgtggtcctcca1260gggccacctggcaccaatggtgttcccgggcaacgaggtgctgcaggtgaacccggtaag1320aatggagccaaaggagacccaggaccacgtggggaacgcggagaagctggttctccaggt1380atcgcaggacctaagggtgaagatggcaaagatggttctcctggagaacctggtgcaaat1440ggacttcctggagctgcaggagaaaggggtgtgcctggattccgaggacctgctggagca1500aatggccttccaggagaaaagggtcctcctggggaccgtggtggcccaggccctgcaggg1560cccagaggtgttgctggagagcccggcagagatggtctccctggaggtccaggattgagg1620ggtattcctggtagcccgggaggaccaggcagtgatgggaaaccagggcctcctggaagc1680caaggagagacgggtcgacccggtcctccaggttcacctggtccgcgaggccagcctggt1740gtcatgggcttccctggtcccaaaggaaacgatggtgctcctggaaaaaatggagaacga1800ggtggccctggaggtcctggccctcagggtcctgctggaaagaatggtgagaccggacct1860cagggtcctccaggacctactggcccttctggtgacaaaggagacacaggaccccctggt1920ccacaaggactacaaggcttgcctggaacgagtggtcccccaggagaaaacggaaaacct1980ggtgaacctggtccaaagggtgaggctggtgcacctggaattccaggaggcaagggtgat2040tctggtgctcccggtgaacgcggacctcctggagcaggagggccccctggacctagaggt2100ggagctggcccccctggtcccgaaggaggaaagggtgctgctggtccccctgggccacct2160ggttctgctggtacacctggtctgcaaggaatgcctggagaaagagggggtcctggaggc2220cctggtccaaagggtgataagggtgagcctggcagctcaggtgtcgatggtgctccaggg2280aaagatggtccacggggtcccactggtcccattggtcctcctggcccagctggtcagcct2340ggagataagggtgaaagtggtgcccctggagttccgggtatagctggtcctcgcggtggc2400cctggtgagagaggcgaacaggggcccccaggacctgctggcttccctggtgctcctggc2460cagaatggtgagcctggtgctaaaggagaaagaggcgctcctggtgagaaaggtgaagga2520ggccctcccggagccgcaggacccgccggaggttctgggcctgccggtcccccaggcccc2580caaggtgtcaaaggcgaacgtggcagtcctggtggtcctggtgctgctggcttccccggt2640ggtcgtggtcctcctggccctcctggcagtaatggtaacccaggccccccaggctccagt2700ggtgctccaggcaaagatggtcccccaggtccacctggcagtaatggtgctcctggcagc2760cccgggatctctggaccaaagggtgattctggtccaccaggtgagaggggagcacctggc2820ccccaggggcctccgggagctccaggcccactaggaattgcaggacttactggagcacga2880ggtcttgcaggcccaccaggcatgccaggtgctaggggcagccccggcccacagggcatc2940aagggtgaaaatggtaaaccaggacctagtggtcagaatggagaacgtggtcctcctggc3000ccccagggtcttcctggtctggctggtacagctggtgagcctggaagagatggaaaccct3060ggatcagatggtctgccaggccgagatggagcgccaggtgccaagggtgaccgtggtgaa3120aatggctctcctggtgcccctggagctcctggtcacccaggccctcctggtcctgtcggt3180ccagctggaaagagcggtgacagaggagaaactggccctgctggtccttctggggccccc3240ggtcctgccggatcaagaggtcctcctggtccccaaggcccacgcggtgacaaaggggaa3300accggtgagcgtggtgctatgggcatcaaaggacatcgcggattccctggcaacccaggg3360gcccccggatctccgggtcccgctggtcatcaaggtgcagttggcagtccaggccctgca3420ggccccagaggacctgttggacctagcgggccccctggaaaggacggagcaagtggacac3480cctggtcccattggaccaccggggccccgaggtaacagaggtgaaagaggatctgagggc3540tccccaggccacccaggacaaccaggccctcctggacctcctggtgcccctggtccatgt3600tgtggtgctggcggggttgctgccattgctggtgttggagccgaaaaagctggtggtttt3660gccccatattatggagatgaaccgatagatttcaaaatcaataccgatgagattatgacc3720tcactcaaatcagtcaatggacaaatagaaagcctcattagtcctgatggttcccgtaaa3780aaccctgcacggaactgcagggacctgaaattctgccatcctgaactccagagtggagaa3840tattgggttgatcctaaccaaggttgcaaattggatgctattaaagtctactgtaacatg3900gaaactggggaaacgtgcataagtgccagtcctttgactatcccacagaagaactggtgg3960acagattctggtgctgagaagaaacatgtttggtttggagaatccatggagggtggtttt4020cagtttagctatggcaatcctgaacttcccgaagacgtcctcgatgtccagctggcattc4080ctccgacttctctccagccgggcctctcagaacatcacatatcactgcaagaatagcatt4140gcatacatggatcatgccagtgggaatgtaaagaaagccttgaagctgatggggtcaaat4200gaaggtgaattcaaggctgaaggaaatagcaaattcacatacacagttctggaggatggt4260tgcacaaaacacactggggaatggggcaaaacagtcttccagtatcaaacacgcaaggcc4320gtcagactacctattgtagatattgcaccctatgatatcggtggtcctgatcaagaattt4380ggtgcggacattggccctgtttgctttttataaaccaaacctgaattc4428<210>4<211>1466<212>PRT<213>牛(bostaurus)<400>4MetMetSerPheValGlnLysGlyThrTrpLeuLeuPheAlaLeuLeu151015HisProThrValIleLeuAlaGlnGlnGluAlaValAspGlyGlyCys202530SerHisLeuGlyGlnSerTyrAlaAspArgAspValTrpLysProGlu354045ProCysGlnIleCysValCysAspSerGlySerValLeuCysAspAsp505560IleIleCysAspAspGlnGluLeuAspCysProAsnProGluIlePro65707580PheGlyGluCysCysAlaValCysProGlnProProThrAlaProThr859095ArgProProAsnGlyGlnGlyProGlnGlyProLysGlyAspProGly100105110ProProGlyIleProGlyArgAsnGlyAspProGlyProProGlySer115120125ProGlySerProGlySerProGlyProProGlyIleCysGluSerCys130135140ProThrGlyGlyGlnAsnTyrSerProGlnTyrGluAlaTyrAspVal145150155160LysSerGlyValAlaGlyG1yGlyIleAlaGlyTyrProGlyProAla165170175GlyProProGlyProProGlyProProGlyThrSerGlyHisProGly180185190AlaProGlyAlaProGlyTyrGlnGlyProProGlyGluProGlyGln195200205AlaGlyProAlaGlyProProGlyProProGlyAlaIleGlyProSer210215220GlyProAlaGlyLysAspGlyGluSerGlyArgProGlyArgProGly225230235240GluArgGlyPheProGlyProProGlyMetLysGlyProAlaGlyMet245250255ProGlyPheProGlyMetLysGlyHisArgGlyPheAspGlyArgAsn260265270GlyGluLysGlyGluThrGlyAlaProGlyLeuLysGlyGluAsnGly275280285ValProGlyGluAsnGlyAlaProGlyProMetGlyProArgGlyAla290295300ProGlyGluArgGlyArgProGlyLeuProGlyAlaAlaGlyAlaArg305310315320GlyAsnAspGlyAlaArgGlySerAspGlyGlnProGlyProProGly325330335ProProGlyThrAlaGlyPheProGlySerProGlyAlaLysGlyGlu340345350ValGlyProAlaGlySerProGlySerSerGlyAlaProGlyGlnArg355360365GlyGluProGlyProGlnGlyHisAlaGlyAlaProGlyProProGly370375380ProProGlySerAsnGlySerProGlyGlyLysGlyGluMetGlyPro385390395400AlaGlyIleProGlyAlaProGlyLeuIleGlyAlaArgGlyProPro405410415GlyProProGlyThrAsnGlyValProGlyGlnArgGlyAlaAlaGly420425430GluProGlyLysAsnGlyAlaLysGlyAspProGlyProArgGlyGlu435440445ArgGlyGluAlaGlySerProGlyIleAlaGlyProLysGlyGluAsp450455460GlyLysAspGlySerProGlyGluProGlyAlaAsnGlyLeuProGly465470475480AlaAlaGlyGluArgGlyValProGlyPheArgGlyProAlaGlyAla485490495AsnGlyLeuProGlyGluLysGlyProProGlyAspArgGlyGlyPro500505510GlyProAlaGlyProArgGlyValAlaGlyGluProGlyArgAspGly515520525LeuProGlyGlyProGlyLeuArgGlyIleProGlySerProGlyGly530535540ProGlySerAspGlyLysProGlyProProGlySerGlnGlyGluThr545550555560GlyArgProGlyProProGlySerProGlyProArgGlyGlnProGly565570575ValMetGlyPheProGlyProLysGlyAsnAspGlyAlaProGlyLys580585590AsnGlyGluArgGlyGlyProGlyGlyProGlyProGlnGlyProAla595600605GlyLysAsnGlyGluThrGlyProGlnGlyProProGlyProThrGly610615620ProSerGlyAspLysGlyAspThrGlyProProGlyProGlnGlyLeu625630635640GlnGlyLeuProGlyThrSerGlyProProGlyGluAsnGlyLysPro645650655GlyGluProGlyProLysGlyGluAlaGlyAlaProGlyIleProGly660665670GlyLysGlyAspSerGlyAlaProGlyGluArgGlyProProGlyAla675680685GlyGlyProProGlyProArgGlyGlyAlaGlyProProGlyProGlu690695700GlyGlyLysGlyAlaAlaGlyProProGlyProProGlySerAlaGly705710715720ThrProGlyLeuGlnGlyMetProGlyGluArgGlyGlyProGlyGly725730735ProGlyProLysGlyAspLysGlyGluProGlySerSerGlyValAsp740745750GlyAlaProGlyLysAspGlyProArgGlyProThrGlyProIleGly755760765ProProGlyProAlaGlyGlnProGlyAspLysGlyGluSerGlyAla770775780ProGlyValProGlyIleAlaGlyProArgGlyGlyProGlyGluArg785790795800GlyGluGlnGlyProProGlyProAlaGlyPheProGlyAlaProGly805810815GlnAsnGlyGluProGlyAlaLysGlyGluArgGlyAlaProGlyGlu820825830LysGlyGluGlyGlyProProGlyAlaAlaGlyProAlaGlyGlySer835840845GlyProAlaGlyProProGlyProGlnGlyValLysGlyGluArgGly850855860SerProGlyGlyProGlyAlaAlaGlyPheProGlyGlyArgGlyPro865870875880ProGlyProProGlySerAsnGlyAsnProGlyProProGlySerSer885890895GlyAlaProGlyLysAspGlyProProGlyProProGlySerAsnGly900905910AlaProGlySerProGlyIleSerGlyProLysGlyAspSerGlyPro915920925ProGlyGluArgGlyAlaProGlyProGlnGlyProProGlyAlaPro930935940GlyProLeuGlylleAlaGlyLeuThrGlyAlaArgGlyLeuAlaGly945950955960ProProGlyMetProGlyAlaArgGlySerProGlyProGlnGlyIle965970975LysGlyGluAsnGlyLysProGlyProSerGlyGlnAsnGlyGluArg980985990GlyProProGlyProGlnGlyLeuProGlyLeuAlaGlyThrAlaGly99510001005GluProGlyArgAspGlyAsnProGlySerAspGlyLeuProGlyArg101010151020AspGlyAlaProGlyAlaLysGlyAspArgGlyGluAsnGlySerPro1025103010351040GlyAlaProGlyAlaProGlyHisProGlyProProGlyProValGly104510501055ProAlaGlyLysSerGlyAspArgGlyGluThrGlyProAlaGlyPro106010651070SerGlyAlaProGlyProAlaGlySerArgGlyProProGlyProGln107510801085GlyProArgGlyAspLysGlyGluThrGlyGluArgGlyAlaMetGly109010951100IleLysGlyHisArgGlyPheProGlyAsnProGlyAlaProGlySer1105111011151120ProGlyProAlaGlyHisGlnGlyAlaValGlySerProGlyProAla112511301135GlyProArgGlyProValGlyProSerGlyProProGlyLysAspGly114011451150AlaSerGlyHisProGlyProIleGlyProProGlyProArgGlyAsn115511601165ArgGlyGluArgGlySerGluGlySerProGlyHisProGlyGlnPro117011751180GlyProProGlyProProGlyAlaProGlyProCysCysGlyAlaGly1185119011951200GlyValAlaAlaIleAlaGlyValGlyAlaGluLysAlaGlyGlyPhe120512101215AlaProTyrTyrGlyAspGluProIleAspPheLysIleAsnThrAsp122012251230GluIleMetThrSerLeuLysSerValAsnGlyGlnIleGluSerLeu123512401245IleSerProAspGlySerArgLysAsnProAlaArgAsnCysArgAsp125012551260LeuLysPheCysHisProGluLeuGlnSerGlyGluTyrTrpValAsp1265127012751280ProAsnGlnGlyCysLysLeuAspAlaIleLysValTyrCysAsnMet128512901295GluThrGlyGluThrCysIleSerAlaSerProLeuThrIleProGln130013051310LysAsnTrpTrpThrAspSerGlyAlaGluLysLysHisValTrpPhe131513201325GlyGluSerMetGluGlyGlyPheGlnPheSerTyrGlyAsnProGlu133013351340LeuProGluAspValLeuAspValGlnLeuAlaPheLeuArgLeuLeu1345135013551360SerSerArgAlaSerGlnAsnIleThrTyrHisCysLysAsnSerIle136513701375AlaTyrMetAspHisAlaSerGlyAsnValLysLysAlaLeuLysLeu138013851390MetGlySerAsnGluGlyGluPheLysAlaGluGlyAsnSerLysPhe139514001405ThrTyrThrValLeuGluAspGlyCysThrLysHisThrGlyGluTrp141014151420GlyLysThrValPheGlnTyrGlnThrArgLysAlaValArgLeuPro1425143014351440IleValAspIleAlaProTyrAspIleGlyGlyProAspGlnGluPhe144514501455GlyAlaAspIleGlyProValCysPheLeu14601465<210>5<211>4428<212>DNA<213>牛(bostaurus)<400>5gaattcagggacatgatgagctttgtgcaaaaggggacctggttacttttcgctctgctt60catcccactgttattttggcacaacaggaagctgttgacggaggatgctcccatctcggt120cagtcttatgcagatagagatgtatggaaaccagaaccgtgccaaatatgcgtctgtgac180tcaggatccgttctctgtgatgacataatatgtgacgaccaagaattagactgccccaac240cctgaaatcccgtttggagaatgttgtgcagtttgcccacagcctccaacagctcccact300cgccctcctaatggtcaaggacctcaaggccccaagggagatccaggtcctcctggtatt360cctgggcgaaatggcgatcctggtcctccaggatcaccaggctccccaggttctcccggc420cctcctggaatctgtgaatcatgtcctactggtggccagaactattctccccagtacgaa480gcatatgatgtcaagtctggagtagcaggaggaggaatcgcaggctatcctgggccagct540ggtcctcctggcccacccggaccccctggcacatctggccatcctggtgcccctggcgct600ccaggataccaaggtccccccggtgaacctgggcaagctggtccggcaggtcctccagga660cctcctggtgctataggtccatctggccctgctggaaaagatggggaatcaggaagaccc720ggacgacctggagagcgaggatttcctggccctcctggtatgaaaggcccagctggtatg780cctggattccctggtatgaaaggacacagaggctttgatggacgaaatggagagaaaggc840gaaactggtgctcctggattaaagggggaaaatggcgttccaggtgaaaatggagctcct900ggacccatgggtccaagaggggctcccggtgagagaggacggccaggacttcctggagcc960gcaggggctcgaggtaatgatggagctcgaggaagtgatggacaaccgggcccccctggt1020cctcctggaactgcaggattccctggttcccctggtgctaagggtgaagttggacctgca1080ggatctcctggttcaagtggcgcccctggacaaagaggagaacctggacctcagggacat1140gctggtgctccaggtccccctgggcctcctgggagtaatggtagtcctggtggcaaaggt1200gaaatgggtcctgctggcattcctggggctcctgggctgataggagctcgtggtcctcca1260gggccacctggcaccaatggtgttcccgggcaacgaggtgctgcaggtgaacccggtaag1320aatggagccaaaggagacccaggaccacgtggggaacgcggagaagctggttctccaggt1380atcgcaggacctaagggtgaagatggcaaagatggttctcctggagaacctggtgcaaat1440ggacttcctggagctgcaggagaaaggggtgtgcctggattccgaggacctgctggagca1500aatggccttccaggagaaaagggtcctcctggggaccgtggtggcccaggccctgcaggg1560cccagaggtgttgctggagagcccggcagagatggtctccctggaggtccaggattgagg1620ggtattcctggtagcccgggaggaccaggcagtgatgggaaaccagggcctcctggaagc1680caaggagagacgggtcgacccggtcctccaggttcacctggtccgcgaggccagcctggt1740gtcatgggcttccctggtcccaaaggaaacgatggtgctcctggaaaaaatggagaacga1800ggtggccctggaggtcctggccctcagggtcctgctggaaagaatggtgagaccggacct1860cagggtcctccaggacctactggcccttctggtgacaaaggagacacaggaccccctggt1920ccacaaggactacaaggcttgcctggaacgagtggtcccccaggagaaaacggaaaacct1980ggtgaacctggtccaaagggtgaggctggtgcacctggaattccaggaggcaagggtgat2040tctggtgctcccggtgaacgcggacctcctggagcaggagggccccctggacctagaggt2100ggagctggcccccctggtcccgaaggaggaaagggtgctgctggtccccctgggccacct2160ggttctgctggtacacctggtctgcaaggaatgcctggagaaagagggggtcctggaggc2220cctggtccaaagggtgataagggtgagcctggcagctcaggtgtcgatggtgctccaggg2280aaagatggtccacggggtcccactggtcccattggtcctcctggcccagctggtcagcct2340ggagataagggtgaaagtggtgcccctggagttccgggtatagctggtcctcgcggtggc2400cctggtgagagaggcgaacaggggcccccaggacctgctggcttccctggtgctcctggc2460cagaatggtgagcctggtgctaaaggagaaagaggcgctcctggtgagaaaggtgaagga2520ggccctcccggagccgcaggacccgccggaggttctgggcctgccggtcccccaggcccc2580caaggtgtcaaaggcgaacgtggcagtcctggtggtcctggtgctgctggcttccccggt2640ggtcgtggtcctcctggccctcctggcagtaatggtaacccaggccccccaggctccagt2700ggtgctccaggcaaagatggtcccccaggtccacctggcagtaatggtgctcctggcagc2760cccgggatctctggaccaaagggtgattctggtccaccaggtgagaggggagcacctggc2820ccccaggggcctccgggagctccaggcccactaggaattgcaggacttactggagcacga2880ggtcttgcaggcccaccaggcatgccaggtgctaggggcagccccggcccacagggcatc2940aagggtgaaaatggtaaaccaggacctagtggtcagaatggagaacgtggtcctcctggc3000ccccagggtcttcctggtctggctggtacagctggtgagcctggaagagatggaaaccct3060ggatcagatggtctgccaggccgagatggagcgccaggtgccaagggtgaccgtggtgaa3120aatggctctcctggtgcccctggagctcctggtcacccaggccctcctggtcctgtcggt3180ccagctggaaagagcggtgacagaggagaaactggccctgctggtccttctggggccccc3240ggtcctgccggatcaagaggtcctcctggtccccaaggcccacgcggtgacaaaggggaa3300accggtgagcgtggtgctatgggcatcaaaggacatcgcggattccctggcaacccaggg3360gcccccggatctccgggtcccgctggtcatcaaggtgcagttggcagtccaggccctgca3420ggccccagaggacctgttggacctagcgggccccctggaaaggacggagcaagtggacac3480cctggtcccattggaccaccggggccccgaggtaacagaggtgaaagaggatctgagggc3540tccccaggccacccaggacaaccaggccctcctggacctcctggtgcccctggtccatgt3600tgtggtgctggcggggttgctgccattgctggtgttggagccgaaaaagctggtggtttt3660gccccatattatggagatgaaccgatagatttcaaaatcaacaccaatgagattatgacc3720tcactcaaatcagtcaatggacaaatagaaagcctcattagtcctgatggttcccgtaaa3780aaccctgcacggaactgcagggacctgaaattctgccatcctgaactccagagtggagaa3840tattgggttgatcctaaccaaggttgcaaattggatgctattaaagtctactgtaacatg3900gaaactggggaaacgtgcataagtgccagtcctttgactatcccacagaagaactggtgg3960acagattctggtgctgagaagaaacatgtttggtttggagaatccatggagggtggtttt4020cagtttagctatggcaatcctgaacttcccgaagacgtcctcgatgtccagctggcattc4080ctccgacttctctccagccgggcctctcagaacatcacatatcactgcaagaatagcatt4140gcatacatggatcatgtcagtgggaatgtaaagaaagccttgaagctgatggggtcaaat4200gaaggtgaattcaaggctgaaggaaatagcaaattcacatacacagttctggaggatggt4260tgcacaaaacacactggggaatggggcaaaacagtcttccagtatcaaacacgcaaggcc4320gtcagactacctattgtagatattgcaccctatgatatcggtggtcctgatcaagaattt4380ggtgcggacattggccctgtttgctttttataaaccaaacctgaattc4428<210>6<211>1466<212>PRT<213>牛(bostaurus)<400>6MetMetSerPheValGlnLysGlyThrTrpLeuLeuPheAlaLeuLeu151015HisProThrValIleLeuAlaGlnGlnGluAlaValAspGlyGlyCys202530SerHisLeuGlyGlnSerTyrAlaAspArgAspValTrpLysProGlu354045ProCysGlnIleCysValCysAspSerGlySerValLeuCysAspAsp505560IleIleCysAspAspGlnGluLeuAspCysProAsnProGlullePro65707580PheGlyGluCysCysAlaValCysProGlnProProThrAlaProThr859095ArgProProAsnGlyGlnGlyProGlnGlyProLysGlyAspProGly100105110ProProGlyIleProGlyArgAsnGlyAspProGlyProProGlySer115120125ProGlySerProGlySerProGlyProProGlyIleCysGluSerCys130135140ProThrGlyGlyGlnAsnTyrSerProGlnTyrGluAlaTyrAspVal145150155160LysSerGlyValAlaGlyGlyGlyIleAlaGlyTyrProGlyProAla165170175GlyProProGlyProProGlyProProGlyThrSerGlyHisProGly180185190AlaProGlyAlaProGlyTyrGlnGlyProProGlyGluProGlyGln195200205AlaGlyProAlaGlyProProGlyProProGlyAlaIleGlyProSer210215220GlyProAlaGlyLysAspGlyGluSerGlyArgProGlyArgProGly225230235240GluArgGlyPheProGlyProProGlyMetLysGlyProAlaGlyMet245250255ProGlyPheProGlyMetLysGlyHisArgGlyPheAspGlyArgAsn260265270GlyGluLysGlyGluThrGlyAlaProGlyLeuLysGlyGluAsnGly275280285ValProGlyGluAsnGlyAlaProGlyProMetGlyProArgGlyAla290295300ProGlyGluArgGlyArgProGlyLeuProGlyAlaAlaGlyAlaArg305310315320GlyAsnAspGlyAlaArgGlySerAspGlyGlnProGlyProProGly325330335ProProGlyThrAlaGlyPheProGlySerProGlyAlaLysGlyGlu340345350ValGlyProAlaGlySerProGlySerSerGlyAlaProGlyGlnArg355360365GlyGluProGlyProGlnGlyHisAlaGlyAlaProGlyProProGly370375380ProProGlySerAsnGlySerProGlyGlyLysGlyGluMetGlyPro385390395400AlaGlyIleProGlyAlaProGlyLeuIleGlyAlaArgGlyProPro405410415GlyProProGlyThrAsnGlyValProGlyGlnArgGlyAlaAlaGly420425430GluProGlyLysAsnGlyAlaLysGlyAspProGlyProArgGlyGlu435440445ArgGlyGluAlaGlySerProGlyIleAlaGlyProLysGlyGluAsp450455460GlyLysAspGlySerProGlyGluProGlyAlaAsnGlyLeuProGly465470475480AlaAlaGlyGluArgGlyValProGlyPheArgGlyProAlaGlyAla485490495AsnGlyLeuProGlyGluLysGlyProProGlyAspArgGlyGlyPro500505510GlyProAlaGlyProArgGlyValAlaGlyGluProGlyArgAspGly515520525LeuProGlyGlyProGlyLeuArgGlyIleProGlySerProGlyGly530535540ProGlySerAspGlyLysProGlyProProGlySerGlnGlyGluThr545550555560GlyArgProGlyProProGlySerProGlyProArgGlyGlnProGly565570575ValMetGlyPheProGlyProLysGlyAsnAspGlyAlaProGlyLys580585590AsnGlyGluArgGlyGlyProGlyGlyProGlyProGlnGlyProAla595600605GlyLysAsnGlyGluThrGlyProGlnGlyProProGlyProThrGly610615620ProSerGlyAspLysGlyAspThrGlyProProGlyProGlnGlyLeu625630635640GlnGlyLeuProGlyThrSerGlyProProGlyGluAsnGlyLysPro645650655GlyGluProGlyProLysGlyGluAlaGlyAlaProGlyIleProGly660665670GlyLysGlyAspSerGlyAlaProGlyGluArgGlyProProGlyAla675680685GlyGlyProProGlyProArgGlyGlyAlaGlyProProGlyProGlu690695700GlyGlyLysGlyAlaAlaGlyProProGlyProProGlySerAlaGly705710715720ThrProGlyLeuGlnGlyMetProGlyGluArgGlyGlyProGlyGly725730735ProGlyProLysGlyAspLysGlyGluProGlySerSerGlyValAsp740745750GlyAlaProGlyLysAspGlyProArgGlyProThrGlyProIleGly755760765ProProGlyProAlaGlyGlnProGlyAspLysGlyGluSerGlyAla770775780ProGlyValProGlyIleAlaGlyProArgGlyGlyProGlyGluArg785790795800GlyGluGlnGlyProProGlyProAlaGlyPheProGlyAlaProGly805810815GlnAsnGlyGluProGlyAlaLysGlyGluArgGlyAlaProGlyGlu820825830LysGlyGluGlyGlyProProGlyAlaAlaGlyProAlaGlyGlySer835840845GlyProAlaGlyProProGlyProGlnGlyValLysGlyGluArgGly850855860SerProGlyGlyProGlyAlaAlaGlyPheProGlyGlyArgGlyPro865870875880ProGlyProProGlySerAsnGlyAsnProGlyProProGlySerSer885890895GlyAlaProGlyLysAspGlyProProGlyProProGlySerAsnGly900905910AlaProGlySerProGlyIleSerGlyProLysGlyAspSerGlyPro915920925ProGlyGluArgGlyAlaProGlyProGlnGlyProProGlyAlaPro930935940GlyProLeuGlyIleAlaGlyLeuThrGlyAlaArgGlyLeuAlaGly945950955960ProProGlyMetProGlyAlaArgGlySerProGlyProGlnGlyIle965970975LysGlyGluAsnGlyLysProGlyProSerGlyGlnAsnGlyGluArg980985990GlyProProGlyProGlnGlyLeuProGlyLeuAlaGlyThrAlaGly99510001005GluProGlyArgAspGlyAsnProGlySerAspGlyLeuProGlyArg101010151020AspGlyAlaProGlyAlaLysGlyAspArgGlyGluAsnGlySerPro1025103010351040GlyAlaProGlyAlaProGlyHisProGlyProProGlyProValGly104510501055ProAlaGlyLysSerGlyAspArgGlyGluThrGlyProAlaGlyPro106010651070SerGlyAlaProGlyProAlaGlySerArgGlyProProGlyProGln107510801085GlyProArgGlyAspLysGlyGluThrGlyGluArgGlyAlaMetGly109010951100IleLysGlyHisArgGlyPheProGlyAsnProGlyAlaProGlySer1105111011151120ProGlyProAlaGlyHisGlnGlyAlaValGlySerProGlyProAla112511301135GlyProArgGlyProValGlyProSerGlyProProGlyLysAspGly114011451150AlaSerGlyHisProGlyProIleGlyProProGlyProArgGlyAsn115511601165ArgGlyGluArgGlySerGluGlySerProGlyHisProGlyGlnPro117011751180GlyProProGlyProProGlyAlaProGlyProCysCysGlyAlaGly1185119011951200GlyValAlaAlaIleAlaGlyValGlyAlaGluLysAlaGlyGlyPhe120512101215AlaProTyrTyrGlyAspGluProIleAspPheLysIleAsnThrAsn122012251230GluIleMetThrSerLeuLysSerValAsnGlyGlnIleGluSerLeu123512401245IleSerProAspGlySerArgLysAsnProAlaArgAsnCysArgAsp125012551260LeuLysPheCysHisProGluLeuGlnSerGlyGluTyrTrpValAsp1265127012751280ProAsnGlnGlyCysLysLeuAspAlaIleLysValTyrCysAsnMet128512901295GluThrGlyGluThrCysIleSerAlaSerProLeuThrIleProGln130013051310LysAsnTrpTrpThrAspSerGlyAlaGluLysLysHisValTrpPhe131513201325GlyGluSerMetGluGlyGlyPheGlnPheSerTyrGlyAsnProGlu133013351340LeuProGluAspValLeuAspValGlnLeuAlaPheLeuArgLeuLeu1345135013551360SerSerArgAlaSerGlnAsnIleThrTyrHisCysLysAsnSerIle136513701375AlaTyrMetAspHisValSerGlyAsnValLysLysAlaLeuLysLeu138013851390MetGlySerAsnGluGlyGluPheLysAlaGluGlyAsnSerLysPhe139514001405ThrTyrThrValLeuGluAspGlyCysThrLysHisThrGlyGluTrp141014151420GlyLysThrValPheGlnTyrGlnThrArgLysAlaValArgLeuPro1425143014351440IleValAspIleAlaProTyrAspIleGlyGlyProAspGlnGluPhe144514501455GlyAlaAspIleGlyProValCysPheLeu14601465<210>7<211>4425<212>DNA<213>野豬(susscrofa)<400>7gaattcagggacatgttcagctttgtggacctccggctcctgctcctcttagcggccacc60gccctcctgacgcacggccaagaggagggccaagaagaaggccaacaaggccaagaagaa120gacatcccaccagtcacctgcgtacagaacggcctcaggtaccatgaccgagacgtgtgg180aaacccgtgccctgccagatctgtgtctgcgacaacggcaatgtgttgtgcgatgacgtg240atctgcgacgaaatcaagaactgtcccagcgccagagtccctgcgggcgagtgctgcccc300gtctgccccgaaggcgaggtgtcacccaccgaccaggaaaccacgggagtcgagggaccc360aagggagacactggcccccgaggccccaggggaccctctggcccccctggccgagacggc420atccctggacaacctggacttcctggaccccccggacctcctggaccccccggaccccct480ggcctcggaggaaactttgctccccagttgtcttatggctatgatgagaagtcagcagga540atttccgtgcccggccccatgggtccttctggtcctcgtggtctctctggcccccctggc600gcacctggtccccaaggtttccaaggcccccctggtgagcctggcgagcctggcgcctcc660ggtcccatgggtccccgtggtcctcctggcccccctggcaagaacggagatgatggtgaa720gctggaaagcctggtcgccctggtgagcgtgggcctcctggacctcagggtgctcgggga780ttgcccggaacagctggcctccctggaatgaagggacacagaggtttcagtggtttggat840ggtgccaagggagatgctggtcctgctggtcccaagggtgagcctggtagccctggtgaa900aatggagctcctggtcagatgggcccccgtggtctgcctggtgagcgaggtcgccctgga960ccccctggccctgctggtgctcgtggaaatgatggtgctactggtgctgctggaccccct1020ggtcccactggccccgctggtcctcctggcttccctggtgctgttggtgctaagggtgaa1080gctggtccccaaggagcccgaggctctgaaggtccccagggtgtgcgtggtgagcctggc1140ccccctggccctgctggtgctgctggccctgctggaaaccctggtgctgatggacagcct1200ggtggcaaaggtgccaacggcgctcctggtattgctggtgctcctggcttccctggtgcc1260cgaggcccctctggaccccagggtcccagcggcccccctggtcccaagggtaacagcggt1320gaacctggtgctcccggcagcaaaggagacactggcgccaagggagagcccggtcccact1380ggtgttcaaggaccccctggccctgctggagaagaaggaaagcgaggagcccgaggtgaa1440cctggacctgctggcctgcctggaccccctggcgagcgtggtggacctggtagccgtggt1500ttccctggcgccgatggtgttgctggtcccaagggtcccgctggtgaacgtggttctcct1560ggccctgctggtcccaaaggttctcctggtgaagctggtcgccccggtgaagctggtctg1620cctggtgccaagggtctgactggaagccctggcagccctggtcctgatggcaaaactggc1680ccccctggtcccgccggtcaagatggtcgccctggacccccaggccctcctggtgcccgt1740ggtcaggctggtgtgatgggtttccctggacctaaaggtgctgctggagagcctggcaaa1800gctggagagcgaggtgttcccggaccccctggcgcagttggtcctgctggcaaagatgga1860gaagctggagctcagggaccccccggacctgctggccccgctggtgagagaggagaacaa1920ggccccgctggctcccctggattccagggtctccctggccctgctggtcctcctggtgaa1980gcaggcaaacccggtgaacagggtgttcctggagatctcggtgcccccggcccctctgga2040gcaagaggcgagagaggtttccccggcgagcgtggtgtgcaaggtccccccggtcctgca2100ggtccccgtggagccaacggtgcccctggcaatgatggtgctaagggtgatgctggtgcc2150cctggagcccctggtagccagggcgcccctggccttcagggaatgcctggcgaacgaggt2220gcagctggtctcccaggtcctaagggtgacagaggagatgctggtcccaaaggtgctgat2280ggtgctcctggcaaagatggcgtccgtggtctgactggccccattggtcctcccggcccc2340gctggtgcccctggtgacaagggtgaaactggtcctagcggtcctgctggtcccactgga2400gctcgtggtgcccccggtgaccgtggtgagcctggtccccccggccctgctggcttcgct2460ggcccccctggtgctgatggccaacctggtgctaaaggcgaacctggtgatgctggtgct2520aaaggcgatgctggtccccccggccctgctggacccactggcccccctggccccattggt2580agcgttggtgctcccggacccaaaggtgctcgtggcagcgctggtcctcctggtgctact2640ggtttccctggtgctgctggccgagtcggtccccccggcccctctggaaatgctggaccc2700cctggccctcctggtcctgctggcaaagaaggcagcaaaggtccccgtggtgagactggc2760cccgctgggcgtcccggtgaagccggtccccctggcccccctggccccgctggtgagaaa2820ggatcccctggtgctgacggacctgctggtgctcccggtactcctggacctcagggtatt2880gctggacagcgtggtgtggtcggcctgcccggtcaacgaggagaaagaggcttccctggt2940cttcccggcccatctggtgaacccggcaaacaaggtccttctggaccaagcggcgaacgt3000ggcccccctggtcccatgggcccccctggattggctggaccccctggcgagtctggacgt3060gagggagcccctggcgctgaaggatcccctggacgagatggtgctcctggccccaagggt3120gaccgtggtgagagcggccctgctggaccccctggtgctcctggtgctcctggtgccccc3180ggccccgttggccctgctggcaagagcggcgatcgtggtgagactggtcctgctggtcct3240gctggtcccgttggccccgttggtgcccgtggccctgctggaccccaaggcccccgtggt3300gacaagggtgagacaggcgaacagggcgacagaggcattaagggtcaccgtggcttctct3360ggtctccagggtccccctggccctcccggctctcctggtgagcaaggtccctccggagct3420tctggtcccgctggtccccgaggtccccctggctctgctggtgctcctggcaaagatgga3480ctcaacggtctccccggccccatcggtccccctgggcctcgtggtcgcactggtgatgct3540ggccctgttggtcctcccggccctcctggaccccccggtccccctggtcctcccagcggc3600ggtttcgacttcagcttcttgccccagccacctcaagagaaggctcacgatggtggccgc3660tactaccgggccgatgatgccaatgtggtccgcgaccgtgacctcgaggtggacaccacc3720ctcaagagcctgagccagcagatcgagaacatccggagccccgaaggcagccgcaagaac3780cccgcccgcacctgccgcgacctcaagatgtgccactccgactggaagagcggagaatac3840tggattgaccccaaccaaggctgcaacctggacgccatcaaagtcttctgcaacatggag3900acaggcgagacctgcgtgtaccccactcagcccagcgtgccccagaagaactggtacatc3960agcaagaaccccaaggacaagaggcacgtctggtacggcgagagcatgaccgacggattc4020cagttcgagtacggcggcgagggctccgatcctgctgacgtggccatccagctgaccttc4080ctgcgcctgatgtccactgaggcttcccagaacatcacctaccactgcaagaacagcgtg4140gcctacatggaccagcagactggcaacctcaagaaggccctgctcctccagggctccaac4200gagatcgagatccgggccgagggcaacagccgcttcacctacagcgtgatctacgacggc4260tgcacgagtcacaccggagcctggggcaagacagtgatcgaatacaaaaccaccaagacc4320tcccgcctgcccatcatcgatgtggcccccttggacgttggcgcccccgaccaagaattc4380ggcatcgaccttagccctgtctgcttcctgtaaactcctgaattc4425<210>8<211>1449<212>PRT<213>野豬(susscrofa)<400>8MetPheSerPheValAspLeuArgLeuLeuLeuLeuLeuAlaAlaThr151015AlaLeuLeuThrHisGlyGlnGluGluGlyGlnGluGluGlyGlnGln202530GlyGlnGluGluAspIleProProValThrCysValGlnAsnGlyLeu354045ArgTyrHisAspArgAspValTrpLysProValProCysGlnIleCys505560ValCysAspAsnGlyAsnValLeuCysAspAspValIleCysAspGlu65707580IleLysAsnCysProSerAlaArgValProAlaGlyGluCysCysPro859095ValCysProGluGlyGluValSerProThrAspGlnGluThrThrGly100105110ValGluGlyProLysGlyAspThrGlyProArgGlyProArgGlyPro115120125SerGlyProProGlyArgAspGlyIleProGlyGlnProGlyLeuPro130135140GlyProProGlyProProGlyProProGlyProProGlyLeuGlyGly145150155160AsnPheAlaProGlnLeuSerTyrGlyTyrAspGluLysSerAlaGly165170175lleSerValProGlyProMetGlyProSerGlyProArgGlyLeuSer180185190GlyProProGlyAlaProGlyProGlnGlyPheGlnGlyProProGly195200205GluProGlyGluProGlyAlaSerGlyProMetGlyProArgGlyPro210215220ProGlyProProGlyLysAsnGlyAspAspGlyGluAlaGlyLysPro225230235240GlyArgProGlyGluArgGlyProProGlyProGlnGlyAlaArgGly245250255LeuProGlyThrAlaGlyLeuProGlyMetLysGlyHisArgGlyPhe260265270SerGlyLeuAspGlyAlaLysGlyAspAlaGlyProAlaGlyProLys275280285GlyGluProGlySerProGlyGluAsnGlyAlaProGlyGlnMetGly290295300ProArgGlyLeuProGlyGluArgGlyArgProGlyProProGlyPro305310315320AlaGlyAlaArgGlyAsnAspGlyAlaThrGlyAlaAlaGlyProPro325330335GlyProThrGlyProAlaGlyProProGlyPheProGlyAlaValGly340345350AlaLysGlyGluAlaGlyProGlnGlyAlaArgGlySerGluGlyPro355360365GlnGlyValArgGlyGluProGlyProProGlyProAlaGlyAlaAla370375380GlyProAlaGlyAsnProGlyAlaAspGlyGlnProGlyGlyLysGly385390395400AlaAsnGlyAlaProGlyIleAlaGlyAlaProGlyPheProGlyAla405410415ArgGlyProSerGlyProGlnGlyProSerGlyProProGlyProLys420425430GlyAsnSerGlyGluProGlyAlaProGlySerLysGlyAspThrGly435440445AlaLysGlyGluProGlyProThrGlyValGlnGlyProProGlyPro450455460AlaGlyGluGluGlyLysArgGlyAlaArgGlyGluProGlyProAla465470475480GlyLeuProGlyProProGlyGluArgGlyGlyProGlySerArgGly485490495PheProGlyAlaAspGlyValAlaGlyProLysGlyProAlaGlyGlu500505510ArgGlySerProGlyProAlaGlyProLysGlySerProGlyGluAla515520525GlyArgProGlyGluAlaGlyLeuProGlyAlaLysGlyLeuThrGly530535540SerProGlySerProGlyProAspGlyLysThrGlyProProGlyPro545550555560AlaGlyGlnAspGlyArgProGlyProProGlyProProGlyAlaArg565570575GlyGlnAlaGlyValMetGlyPheProGlyProLysGlyAlaAlaGly580585590GluProGlyLysAlaGlyGluArgGlyValProGlyProProGlyAla595600605ValGlyProAlaGlyLysAspGlyGluAlaGlyAlaGlnGlyProPro610615620GlyProAlaGlyProAlaGlyGluArgGlyGluGlnGlyProAlaGly625630635640SerProGlyPheGlnGlyLeuProGlyProAlaGlyProProGlyGlu645650655AlaGlyLysProGlyGluGlnGlyValProGlyAspLeuGlyAlaPro660665670GlyProSerGlyAlaArgGlyGluArgGlyPheProGlyGluArgGly675680685ValGlnGlyProProGlyProAlaGlyProArgGlyAlaAsnGlyAla690695700ProGlyAsnAspGlyAlaLysGlyAspAlaGlyAlaProGlyAlaPro705710715720GlySerGlnGlyAlaProGlyLeuGlnGlyMetProGlyGluArgGly725730735AlaAlaGlyLeuProGlyProLysGlyAspArgGlyAspAlaGlyPro740745750LysGlyAlaAspGlyAlaProGlyLysAspGlyValArgGlyLeuThr755760765GlyProIleGlyProProGlyProAlaGlyAlaProGlyAspLysGly770775780GluThrGlyProSerGlyProAlaGlyProThrGlyAlaArgGlyAla785790795800ProGlyAspArgGlyGluProGlyProProGlyProAlaGlyPheAla805810815GlyProProGlyAlaAspGlyGlnProGlyAlaLysGlyGlyProThr820825830GlyProProGlyProIleGlySerValGlyAlaProGlyProLysGly835840845AlaArgGlySerAlaGlyProProGlyAlaThrGlyPheProGlyAla850855860AlaGlyArgValGlyProProGlyProSerGlyAsnAlaGlyProPro865870875880GlyProProGlyProAlaGlyLysGluGlySerLysGlyProArgGly885890895GluThrGlyProAlaGlyArgProGlyGluAlaGlyProProGlyPro900905910ProGlyProAlaGlyGluLysGlySerProGlyAlaAspGlyProAla915920925GlyAlaProGlyThrProGlyProGlnGlyIleAlaGlyGlnArgGly930935940ValValGlyLeuProGlyGlnArgGlyGluArgGlyPheProGlyLeu945950955960ProGlyProSerGlyGluProGlyLysGlnGlyProSerGlyProSer965970975GlyGluArgGlyProProGlyProMetGlyProProGlyLeuAlaGly980985990ProProGlyGluSerGlyArgGluGlyAlaProGlyAlaGluGlySer99510001005ProGlyArgAspGlyAlaProGlyProLysGlyAspArgGlyGluSer101010151020GlyProAlaGlyProProGlyAlaProGlyAlaProGlyAlaProGly1025103010351040ProValGlyProAlaGlyLysSerGlyAspArgGlyGluThrGlyPro104510501055AlaGlyProAlaGlyProValGlyProValGlyAlaArgGlyProAla106010651070GlyProGlnGlyProArgGlyAspLysGlyGluThrGlyGluGlnGly107510801085AspArgGlyIleLysGlyHisArgGlyPheSerGlyLeuGlnGlyPro109010951100ProGlyProProGlySerProGlyGluGlnGlyProSerGlyAlaSer1105111011151120GlyProAlaGlyProArgGlyProProGlySerAlaGlyAlaProGly112511301135LysAspGlyLeuAsnGlyLeuProGlyProIleGlyProProGlyPro114011451150ArgGlyArgThrGlyAspAlaGlyProValGlyProProGlyProPro115511601165GlyProProGlyProProGlyProProSerGlyGlyPheAspPheSer117011751180PheLeuProGlnProProGlnGluLysAlaHisAspGlyGlyArgTyr1185119011951200TyrArgAlaAspAspAlaAsnValValArgAspArgAspLeuGluVal120512101215AspThrThrLeuLysSerLeuSerGlnGlnIleGluAsnIleArgSer122012251230ProGluGlySerArgLysAsnProAlaArgThrCysArgAspLeuLys123512401245MetCysHisSerAspTrpLysSerGlyGluTyrTrpIleAspProAsn125012551260GlnGlyCysAsnLeuAspAlaIleLysValPheCysAsnMetGluThr1265127012751280GlyGluThrCysValTyrProThrGlnProSerValProGlnLysAsn128512901295TrpTyrIleSerLysAsnProLysAspLysArgHisValTrpTyrGly130013051310GluSerMetThrAspGlyPheGlnPheGluTyrGlyGlyGluGlySer131513201325AspProAlaAspValAlaIleGlnLeuThrPheLeuArgLeuMetSer133013351340ThrGluAlaSetGlnAsnIleThrTyrHisCysLysAsnSerValAla1345135013551360TyrMetAspGlnGlnThrGlyAsnLeuLysLysAlaLeuLeuLeuGln136513701375GlySerAsnGluIleGluIleArgAlaGluGlyAsnSerArgPheThr138013851390TyrSerValIleTyrAspGlyCysThrSerHisThrGlyAlaTrpGly139514001405LysThrValIleGluTyrLysThrThrLysThrSerArgLeuProIle141014151420IleAspValAlaProLeuAspValGlyAlaProAspGlnGluPheGly1425143014351440IleAspLeuSerProValCysPheLeu1445<210>9<211>4498<212>DNA<213>野豬(susscrofa)<400>9gaattcagggacatgctcagctttgtggatacgcggactttgttgctgcttgcagtaact60tcgtgcctagcaacatgccaatctttacaagaggcaactgcaagaaagggcccaactgga120gatagaggaccacgcggagaaaggggtccaccaggcccaccaggcagagatggtgatgat180ggtatcccaggccctcctggtccacctggtcctcctggcccccctggtcttggcgggaac240tttgctgctcagtatgatggaaaaggagttggagctggccctggaccaatgggtttgatg300ggacctaggggccctcctggggcagttggagcccctggccctcaaggtttccaaggacct360gctggtgagcctggcgaacctggtcagactggtcctgctggtgctcgtggtccacctggc420cctcctggcaaggctggtgaggatggtcaccctggaaaacccggacgacctggtgagaga480ggagttgttggaccacagggtgctcgtggtttccctggaactcctggacttcctggcttc540aagggcattaggggtcacaacggtctggatggattgaagggacagcccggtgctccaggt600gtgaagggcgaacctggtgcccccggcgaaaatggaactccaggtcaaacaggagctcgc660gggcttcctggtgagagaggacgtgtcggtgctcctggcccagctggtgcccgtggaaat720gatggaagtgtgggtcctgtgggtcctgctggtcccattgggtctgctggccctccaggc780ttcccaggtgctcctggccccaagggtgaacttggacctgttggtaaccctggtcctgca840ggtcctgcgggtccccgtggtgaagtgggtcttccaggtgtttctggccctgttggacct900cctggcaaccctggagccaacggccttcctggtgctaaaggtgctgctggcctgcttggt960gttgctggggctcctggcctccctgggcctcgaggtattcctggccctgctggtgctgct1020ggtgctactggtgccagaggtcttgttggtgagcctggtccagctggttccaaaggagag1080agcggcaacaagggcgagcctggtgctgctgggccccaaggtcctcctggtcccagtggt1140gaagaaggaaagagaggccccaatggagaagttggatctgctggccccccaggacctcct1200gggctgaggggaaatcctggttctcgtggtctccctggagctgatggcagagctggtgtc1260atgggccctcctggtagtcgtggtccaactggccctgctggtgttcgaggtcccaatgga1320gattctggtcgccctggagagcctggccttatgggaccccgaggtttccctggatcccct1380ggaaatgttggtccagctggtaaagaaggtcctgcgggcctccctggtattgatggcagg1440cctggaccaattggcccagctggagcaagaggagagcctggcaacattggattccctgga1500cccaaaggccccactggtgatcctggcaaaaatggtgaaaaaggtcatgctggtctggct1560ggtgctcggggtgccccaggtcctgatggaaacaatggtgctcagggacctcctggacca1620cagggtgttcaaggtggaaaaggtgaacaaggtcccgctggtcctccaggcttccagggt1680ctccctggccccgcaggtacagctggtgaagttggcaaaccaggagaaaggggtatccct1740ggtgaatttggtctccctggtcctgctggtccaagaggggagcgtggtcccccaggtgaa1800agtggtgctgctggtcctgctggtcctattggaagccgaggtccttctggacccccgggg1860cctgatggcaacaagggcgaacctggtgtgcttggtgctccaggcactgctggtccatct1920ggtcctagtggactcccaggagagaggggtgctgctggcatacctggaggcaagggagaa1980aagggtgaaactggtctcagaggtgacgttggtagccctggcagagatggtgctcgtggt2040gctcctggtgctgtaggtgcccctggtcctgctggagccaatggggaccggggtgaagct2100ggccctgctggccctgctggccctgctggtcctcgtggtagtcctggtgaacgtggtgag2160gttggtcctgctggccccaatggatttgctggtcctgctggtgctgccggtcaacctggt2220gctaaaggagagagaggaaccaaagggcccaaaggtgaaaatggtcctgttggtcccaca2280ggccctgttggagctgctggcccagctggtccaaatggtcctcctggtcctgctggcagt2340cgtggtgatggcggcccccctggtgctactggtttccctggtgctgctggacggattggt2400cctcctggaccttctggtatctctgggccccctggaccccctggtcctgctgggaaagaa2460ggacttcgtgggcctcgtggtgaccaaggtccagttggtcgaactggagaaacaggtgca2520tctggcccccctggctttgctggtgagaaaggtccctctggagagcctggtactgctgga2580cctcctggtaccccaggtcctcaaggtattcttggtgctcctggttttctgggtctccct2640ggctctagaggtgaacgtggtctaccaggtgttgctggatcagtgggtgaacctggcccc2700ctcggcattgcaggcccacctggggcccgtggtccccctggtgctgtgggtaatcctggt2760gtcaatggtgctcctggtgaagctggtcgtgatggcaaccctggaagcgatggtccccca2820ggccgagatggtcaagctggacacaagggcgagcgtggttaccctggtaatcctggtcct2880gctggtgctgcaggagcacctggtcctcaaggtgctgtgggtcccgctggcaaacatgga2940aaccgtggtgaacctggtcctgctggttctgttggtcctgctggtgctgttggtccaaga3000ggtcctagtggcccacaaggtattcgaggtgagaagggagagcctggtgataaggggccc3060agaggtcttcctggcttgaagggacacaacggattgcaaggtcttcctggtcttgctggt3120catcatggtgatcaaggtgctcctggccctgtgggtcctgctggtcctaggggtccagct3180ggtccttctggccctgctggcaaagatggtcgcactggacaacctggtgcagttggacct3240gctggcattcgtggctctcaaggaagccaaggtcctgctggtcctcctggtcctcctggc3300cctcctggaccacctggcccaagtggtggtggttatgattttggatatgaaggagacttc3360tacagggctgaccagcctcgctcaccaccttctctcagacccaaggattatgaagttgat3420gctactctgaaatctctcaacaaccagattgagactctacttactccagaaggctctagg3480aagaacccagctcgcacatgccgtgacttgagactcagccacccagaatggagtagtggt3540tactactggattgaccctaaccaaggatgtactatggatgctatcaaagtatactgtgat3600ttctctactggtgaaacctgcattcgggctcaacctgaaaacatcccagccaaaaactgg3660tacagaaactccaaggtcaagaagcacgtctggttaggagaaactatcaatggtggtacc3720cagtttgaatataatatggaaggagttaccaccaaggaaatggctacacaacttgccttc3780atgcgcctgctggccaaccatgcctcccaaaacatcacctaccattgcaagaacagcatt3840gcatacatggatgaagagactggcaacctgaaaaaggctgtcattctgcaaggatccaat3900gatgttgaacttgttgccgagggcaacagcagattcacctacactgttcttgtagatggc3960tgttctaaaaaaacaaatgaatggagaaaaacaatcattgaatataaaacaaataagcca4020tctcgcctgcctatccttgatattgcacctttggacatcggtgatgctgaccaagaagtc4080agtgtggacgttggcccagtctgtttcaaataaatgaactcaacctaaattaaagaaaaa4140ggaaatctgaaaaatttctctctttgccatttctttttcttctttttaactgaaagctga4200atcattccatttcttctgcacatctacttgcttaaattgtgggcaaaagagaaggagaag4260gattgatcagagcatcgtgcaatacaattaattcgttccctgtccctcttcccctcccca4320aaagatttggaatttttttcaacattctaacacctgttgtggaaaatgtcaacctttgta4380agaaaaccaaaaataaaaattgaaaaataaaataaaaaccatgaacatttgcaccacttg4440tggcttttgaatatcttccacagagggaagtttaaaacccaaacttccacctgaattc4498<210>10<211>1366<212>PRT<213>野豬(susscrofa)<400>10MetLeuSerPheValAspThrArgThrLeuLeuLeuLeuAlaValThr151015SerCysLeuAlaThrCysGlnSerLeuGlnGluAlaThrAlaArgLys202530GlyProThrGlyAspArgGlyProArgGlyGluArgGlyProProGly354045ProProGlyArgAspGlyAspAspGlyIleProGlyProProGlyPro505560ProGlyProProGlyProProGlyLeuGlyGlyAsnPheAlaAlaGln65707580TyrAspGlyLysGlyValGlyAlaGlyProGlyProMetGlyLeuMet859095GlyProArgGlyProProGlyAlaValGlyAlaProGlyProGlnGly100105110PheGlnGlyProAlaGlyGluProGlyGluProGlyGlnThrGlyPro115120125AlaGlyAlaArgGlyProProGlyProProGlyLysAlaGlyGluAsp130135140GlyHisProGlyLysProGlyArgProGlyGluArgGlyValValGly145150155160ProGlnGlyAlaArgGlyPheProGlyThrProGlyLeuProGlyPhe165170175LysGlyIleArgGlyHisAsnGlyLeuAspGlyLeuLysGlyGlnPro180185190GlyAlaProGlyValLysGlyGluProGlyAlaProGlyGluAsnGly195200205ThrProGlyGlnThrGlyAlaArgGlyLeuProGlyGluArgGlyArg210215220ValGlyAlaProGlyProAlaGlyAlaArgGlyAsnAspGlySerVal225230235240GlyProValGlyProAlaGlyProIleGlySerAlaGlyProProGly245250255PheProGlyAlaProGlyProLysGlyGluLeuGlyProValGlyAsn260265270ProGlyProAlaGlyProAlaGlyProArgGlyGluValGlyLeuPro275280285GlyValSerGlyProValGlyProProGlyAsnProGlyAlaAsnGly290295300LeuProGlyAlaLysGlyAlaAlaGlyLeuLeuGlyValAlaGlyAla305310315320ProGlyLeuProGlyProArgGlyIleProGlyProAlaGlyAlaAla325330335GlyAlaThrGlyAlaArgGlyLeuValGlyGluProGlyProAlaGly340345350SerLysGlyGluSerGlyAsnLysGlyGluProGlyAlaAlaGlyPro355360365GlnGlyProProGlyProSerGlyGluGluGlyLysArgGlyProAsn370375380GlyGluValGlySerAlaGlyProProGlyProProGlyLeuArgGly385390395400AsnProGlySerArgGlyLeuProGlyAlaAspGlyArgAlaGlyVal405410415MetGlyProProGlySerArgGlyProThrGlyProAlaGlyValArg420425430GlyProAsnGlyAspSerGlyArgProGlyGluProGlyLeuMetGly435440445ProArgGlyPheProGlySerProGlyAsnValGlyProAlaGlyLys450455460GluGlyProAlaGlyLeuProGlyIleAspGlyArgProGlyProIle465470475480GlyProAlaGlyAlaArgGlyGluProGlyAsnIleGlyPheProGly485490495ProLysGlyProThrGlyAspProGlyLysAsnGlyGluLysGlyHis500505510AlaGlyLeuAlaGlyAlaArgGlyAlaProGlyProAspGlyAsnAsn515520525GlyAlaGlnGlyProProGlyProGlnGlyValGlnGlyGlyLysGly530535540GluGlnGlyProAlaGlyProProGlyPheGlnGlyLeuProGlyPro545550555560AlaGlyThrAlaGlyGluValGlyLysProGlyGluArgGlyIlePro565570575GlyGluPheGlyLeuProGlyProAlaGlyProArgGlyGluArgGly580585590ProProGlyGluSerGlyAlaAlaGlyProAlaGlyProIleGlySer595600605ArgGlyProSerGlyProProGlyProAspGlyAsnLysGlyGluPro610615620GlyValLeuGlyAlaProGlyThrAlaGlyProSerGlyProSerGly625630635640LeuProGlyGluArgGlyAlaAlaGlyIleProGlyGlyLysGlyGlu645650655LysGlyGluThrGlyLeuArgGlyAspValGlySerProGlyArgAsp660665670GlyAlaArgGlyAlaProGlyAlaValGlyAlaProGlyProAlaGly675680685AlaAsnGlyAspArgGlyGluAlaGlyProAlaGlyProAlaGlyPro690695700AlaGlyProArgGlySerProGlyGluArgGlyGluValGlyProAla705710715720GlyProAsnGlyPheAlaGlyProAlaGlyAlaAlaGlyGlnProGly725730735AlaLysGlyGluArgGlyThrLysGlyProLysGlyGluAsnGlyPro740745750ValGlyProThrGlyProValGlyAlaAlaGlyProAlaGlyProAsn755760765GlyProProGlyProAlaGlySerArgGlyAspGlyGlyProProGly770775780AlaThrGlyPheProGlyAlaAlaGlyArgIleGlyProProGlyPro785790795800SerGlyIleSerGlyProProGlyProProGlyProAlaGlyLysGlu805810815GlyLeuArgGlyProArgGlyAspGlnGlyProValGlyArgThrGly820825830GluThrGlyAlaSerGlyProProGlyPheAlaGlyGluLysGlyPro835840845SerGlyGluProGlyThrAlaGlyProProGlyThrProGlyProGln850855860GlyIleLeuGlyAlaProGlyPheLeuGlyLeuProGlySerArgGly865870875880GluArgGlyLeuProGlyValAlaGlySerValGlyGluProGlyPro885890895LeuGlyIleAlaGlyProProGlyAlaArgGlyProProGlyAlaVal900905910GlyAsnProGlyValAsnGlyAlaProGlyGluAlaGlyArgAspGly915920925AsnProGlySerAspGlyProProGlyArgAspGlyGlnAlaGlyHis930935940LysGlyGluArgGlyTyrProGlyAsnProGlyProAlaGlyAlaAla945950955960GlyAlaProGlyProGlnGlyAlaValGlyProAlaGlyLysHisGly965970975AsnArgGlyGluProGlyProAlaGlySerValGlyProAlaGlyAla980985990ValGlyProArgGlyProSerGlyProGlnGlyIleArgGlyGluLys99510001005GlyGluProGlyAspLysGlyProArgGlyLeuProGlyLeuLysGly101010151020HisAsnGlyLeuGlnGlyLeuProGlyLeuAlaGlyHisHisGlyAsp1025103010351040GlnGlyAlaProGlyProValGlyProAlaGlyProArgGlyProAla104510501055GlyProSerGlyProAlaGlyLysAspGlyArgThrGlyGlnProGly106010651070AlaValGlyProAlaGlyIleArgGlySerGlnGlySerGlnGlyPro107510801085AlaGlyProProGlyProProGlyProProGlyProProGlyProSer109010951100GlyGlyGlyTyrAspPheGlyTyrGluGlyAspPheTyrArgAlaAsp1105111011151120GlnProArgSerProProSerLeuArgProLysAspTyrGluValAsp112511301135AlaThrLeuLysSerLeuAsnAsnGlnIleGluThrLeuLeuThrPro114011451150GluGlySerArgLysAsnProAlaArgThrCysArgAspLeuArgLeu115511601165SerHisProGluTrpSerSerGlyTyrTyrTrpIleAspProAsnGln117011751180GlyCysThrMetAspAlaIleLysValTyrCysAspPheSerThrGly1185119011951200GluThrCysIleArgAlaGlnProGluAsnIleProAlaLysAsnTrp120512101215TyrArgAsnSerLysValLysLysHisValTrpLeuGlyGluThrIle122012251230AsnGlyGlyThrGlnPheGluTyrAsnMetGluGlyValThrThrLys123512401245GluMetAlaThrGlnLeuAlaPheMetArgLeuLeuAlaAsnHisAla125012551260SerGlnAsnIleThrTyrHisCysLysAsnSerIleAlaTyrMetAsp1265127012751280GluGluThrGlyAsnLeuLysLysAlaValIleLeuGlnGlySerAsn128512901295AspValGluLeuValAlaGluGlyAsnSerArgPheThrTyrThrVal130013051310LeuValAspGlyCysSerLysLysThrAsnGluTrpArgLysThrIle131513201325IleGluTyrLysThrAsnLysProSerArgLeuProIleLeuAspIle133013351340AlaProLeuAspIleGlyAspAlaAspGlnGluValSerValAspVal1345135013551360GlyProValCysPheLys1365<210>11<211>4428<212>DNA<213>野豬(susscrofa)<400>11gaattcagggacatgatgagctttgtgcaaaaggggacctggttactttttgctctactt60catcccactgttattttggcacaacaacaggaagctattgaaggaggatgctcccatctt120ggtcagtcctatgcggatagagatgtctggaagccagaaccatgtcaaatatgcgtctgt180gactcaggatctgttctctgcgatgatataatatgtgatgatcaagaattagactgtccc240aaccctgagatcccatttggagaatgttgtgcagtttgtccacaacctccaacagctccc300acccgccctcccaatggtcatggacctcaaggccccaagggagatccaggccctcctggt360attcctgggagaaatggagaccctggtcttccaggacaaccaggttcccctggttctcct420gggcctcctggaatctgtgaatcatgccctactggtggccagaactattctccccagtat480gagtcatatgatgtcaaggctggagtagcaggaggaggaatcggaggctatcctgggcca540gcaggtccccctggcccacctggtccccctggtgtatctggtcatcctggtgcccctggt600tctccaggataccaagggccccctggtgaacctgggcaagctggtcctgcaggtcctcca660gggcctcctggtgctataggtccatctggtcctgccggaaaagatggggagtcaggaaga720cccggacgacctggagaacgaggattgcctggccctccaggtctcaaaggtccagctggc780atgcctggattccctggtatgaaagggcatagaggctttgatggacgaaatggagaaaaa840ggtgatacaggtgctcctgggctgaagggtgaaaatggccttccaggtgaaaatggagct900cctggacccatgggtccaagaggggctcctggtgagcgaggacggccaggacttcctgga960gctgcaggggctcgaggtaatgatggtgcccgaggaagtgatggacaaccaggtccccct1020ggtccccctggaactgcaggattccctggttcccctggtgctaagggtgaagttggaccc1080gcgggatctcctggtccaagtggatcccctggacaaagaggagaacctggacctcaggga1140catgccggtgctgcaggtcctcctggccctcctgggagtaatggtagtcctggtggcaaa1200ggtgaaatgggtcctgctggcatccctggagctcctggattgatgggagcccgtggtcct1260ccaggaccacctggtaccaatggtgctcctgggcaacgaggtgcagcaggtgaacctggt1320aaaaatggggccaaaggagagccaggaccacgtggtgaacgtggggaagctggttctccg1380ggtattccaggacccaagggtgaagatggcaaagatggttctcctggagaacctggtgca1440aatggacttccaggagctgcaggagaaaggggtatgcctggattccgaggagctcctgga1500gcaaatggccttccaggagaaaagggtcccgctggcgagcgcggtggtccaggccccgca1560ggccccagaggagttgccggagaacctggccgagatggtgttcctggaggtccaggattg1620aggggcatgcccggtagccccggaggaccaggcagtgatgggaaaccaggacctcctgga1680agtcagggagaaagtggtcgaccaggtcctccaggctcacctggtccccgaggtcagcct1740ggagtcatgggcttccctggtcctaaaggaaatgacggtgctcctggaaagaatggagaa1800agaggtggccctggaggtcccggccttccgggtcctcctggaaagaatggtgagacagga1860cctcagggtcccccaggacctactgggccaggtggtgacaaaggagacacaggaccccct1920ggtcaacaaggattacaaggcttgcctggaaccagtggtcctccaggagaaaatggaaaa1980cctggtgaacccggcccaaaaggtgaagctggtgcacctggaattccaggaggcaagggt2040gattctggtgcccccggtgaacgtggacctcctggtgcagtaggtccctcaggacctaga2100ggtggagctggcccccctggtcccgaaggaggaaagggccctgctggtccccctgggccg2160cctggtgccgctggtacacctggtctgcaagggatgcctggagaaagaggaggttctgga2220ggccccggcccaaagggtgacaagggtgaccctggcggttcaggtgctgatggtgctcca2280ggaaaagatggtccaaggggtcctactggtcccattggtccccctggtccagctggtcag2340cctggagataagggtgaaagtggtgcccctggacttcctggtatagctggtcctcgtggt2400ggccctggtgagagaggtgaacatgggccaccaggacctgccggcttccctggtgctcct2460ggccagaacggtgagcctggtgccaaaggagaaagaggcgctcctggtgagaaaggtgaa2520ggaggacctcctgggattgcaggacagcccggaggcactgggcctcctggtccccctggt2580ccccaaggtgtcaaaggtgaacgtggcagtcctggtggtcctggtgctgctgggttcccc2640ggtggtcgtggtcttcctggtcctcctggcagtaacggtaacccaggcccccctggctcc2700agtggtcctccaggcaaagatggtcccccaggtccacctggtagcagtggtgctcctggc2760agccctggagtatctggaccgaaaggtgatgccggtcaaccaggtgaaaaaggatcacct2820ggcccccagggccctccgggagctccaggcccaggtggaatttcagggattactggagca2880cgaggtctcgcaggcccaccaggcatgccaggtgctaggggaagccctggcccacagggc2940gtcaagggtgaaaatggaaaaccaggacctagtggtctcaatggagaacgtggtcctcct3000ggaccccagggtcttcctggtctggctggtgcagctggtgaacctggacgagatggaaac3060cctggatcagatggtctgccaggccgagacggagctcccggtagcaagggcgatcgtggt3120gaaaatggctctcctggtgcccctggtgctcctggtcacccaggcccacctggccctgtt3180ggtcctgctggaaagaatggtgacagaggagaaactggccctgctggtcctgctggtgct3240ccaggtcctgctggttcaagaggtgctcctggtccccaaggcccacgcggtgacaaaggt3300gaaaccggtgaacgtggtgctaatggcatcaaaggacatcgaggattccctggtaatcca3360ggtgccccaggttctccaggtcccgctggtcaccaaggtgcagtaggtagcccaggacct3420gcaggccccagaggacctgttggaccgagtgggccccctggcaaagatggagcaagtgga3480caccctggtcccattggaccaccagggcctcgaggtaacagaggtgaaagaggatctgag3540ggctccccaggccatccaggacaaccaggccctcctggaccccctggtgcccctggtcca3600tgttgtggtggtggggctgctgccatcgctggtgttggaggtgaaaaagctggtggtttt3660gccccatattatggagatgaaccaatggatttcaaaatcaacaccgacgagattatgact3720tcacttaaatccgtcaacggacaaatagaaagcctcattagtcccgatggttctcgtaaa3780aaccctgctcgtaactgcagagacctaaaattctgccatcctgagctcaagagcggagaa3840tattgggttgatcctaaccaaggctgcaaaatggatgctattaaagtattttgtaacatg3900gaaactggggaaacatgcataagtgccagtccttctactgttccacgtaagaactggtgg3960acagattctggtgctgagaagaaatatgtttggtttggagaatccatgaatggtggtttt4020cagtttagctatggcaatcctgaacttcctgaagatgtccttgatgtccagttggcattc4080cttcgacttctctctagccgagcttcccagaacatcacatatcactgcaagaatagcatt4140gcgtacatggaacatgccagtgggaatgtaaagaaagccttgaggctgatgggatcaaat4200gaaggtgaattcaaggctgaaggaaatagcaaattcacatacaccgttctggaggatggt4260tgcactaaacacactggggaatggggcaagacagtcttcgaatatcgaacacgcaaggct4320gtgagactacctattgtagatattgcaccctatgatattggtggtcctgatcaagaattt4380ggtgcggacattggccctgtttgctttttataaaccaaacctgaattc4428<210>12<211>1466<212>PRT<213>野豬(susscrofa)<400>12MetMetSerPheValGlnLysGlyThrTrpLeuLeuPheAlaLeuLeu151015HisProThrValIleLeuAlaGlnGlnGlnGluAlaIleGluGlyGly202530CysSerHisLeuGlyGlnSerTyrAlaAspArgAspValTrpLysPro354045GluProCysGlnIleCysValCysAspSerGlySerValLeuCysAsp505560AspIleIleCysAspAspGlnGluLeuAspCysProAsnProGluIle65707580ProPheGlyGluCysCysAlaValCysProGlnProProThrAlaPro859095ThrArgProProAsnGlyHisGlyProGlnGlyProLysGlyAspPro100105110GlyProProGlyIleProGlyArgAsnGlyAspProGlyLeuProGly115120125GlnProGlySerProGlySerProGlyProProGlyIleCysGluSer130135140CysProThrGlyGlyGlnAsnTyrSerProGlnTyrGluSerTyrAsp145150155160ValLysAlaGlyValAlaGlyGlyGlyIleGlyGlyTyrProGlyPro165170175AlaGlyProProGlyProProGlyProProGlyValSerGlyHisPro180185190GlyAlaProGlySerProGlyTyrGlnGlyProProGlyGluProGly195200205GlnAlaGlyProAlaGlyProProGlyProProGlyAlaIleGlyPro210215220SerGlyProAlaGlyLysAspGlyGluSerGlyArgProGlyArgPro225230235240GlyGluArgGlyLeuProGlyProProGlyLeuLysGlyProAlaGly245250255MetProGlyPheProGlyMetLysGlyHisArgGlyPheAspGlyArg260265270AsnGlyGluLysGlyAspThrGlyAlaProGlyLeuLysGlyGluAsn275280285GlyLeuProGlyGluAsnGlyAlaProGlyProMetGlyProArgGly290295300AlaProGlyGluArgGlyArgProGlyLeuProGlyAlaAlaGlyAla305310315320ArgGlyAsnAspGlyAlaArgGlySerAspGlyGlnProGlyProPro325330335GlyProProGlyThrAlaGlyPheProGlySerProGlyAlaLysGly340345350GluValGlyProAlaGlySerProGlyProSerGlySerProGlyGln355360365ArgGlyGluProGlyProGlnGlyHisAlaGlyAlaAlaGlyProPro370375380GlyProProGlySerAsnGlySerProGlyGlyLysGlyGluMetGly385390395400ProAlaGlyIleProGlyAlaProGlyLeuMetGlyAlaArgGlyPro405410415ProGlyProProGlyThrAsnGlyAlaProGlyGlnArgGlyAlaAla420425430GlyGluProGlyLysAsnGlyAlaLysGlyGluProGlyProArgGly435440445GluArgGlyGluAlaGlySerProGlyIleProGlyProLysGlyGlu450455460AspGlyLysAspGlySerProGlyGluProGlyAlaAsnGlyLeuPro465470475480GlyAlaAlaGlyGluArgGlyMetProGlyPheArgGlyAlaProGly485490495AlaAsnGlyLeuProGlyGluLysGlyProAlaGlyGluArgGlyGly500505510ProGlyProAlaGlyProArgGlyValAlaGlyGluProGlyArgAsp515520525GlyValProGlyGlyProGlyLeuArgGlyMetProGlySerProGly530535540GlyProGlySerAspGlyLysProGlyProProGlySerGlnGlyGlu545550555560SerGlyArgProGlyProProGlySerProGlyProArgGlyGlnPro565570575GlyValMetGlyPheProGlyProLysGlyAsnAspGlyAlaProGly580585590LysAsnGlyGluArgGlyGlyProGlyGlyProGlyLeuProGlyPro595600605ProGlyLysAsnGlyGluThrGlyProGlnGlyProProGlyProThr610615620GlyProGlyGlyAspLysGlyAspThrGlyProProGlyGlnGlnGly625630635640LeuGlnGlyLeuProGlyThrSerGlyProProGlyGluAsnGlyLys645650655ProGlyGluProGlyProLysGlyGluAlaGlyAlaProGlyIlePro660665670GlyGlyLysGlyAspSerGlyAlaProGlyGluArgGlyProProGly675680685AlaValGlyProSerGlyProArgGlyGlyAlaGlyProProGlyPro690695700GluGlyGlyLysGlyProAlaGlyProProGlyProProGlyAlaAla705710715720GlyThrProGlyLeuGlnGlyMetProGlyGluArgGlyGlySerGly725730735GlyProGlyProLysGlyAspLysGlyAspProGlyGlySerGlyAla740745750AspGlyAlaProGlyLysAspGlyProArgGlyProThrGlyProIle755760765GlyProProGlyProAlaGlyGlnProGlyAspLysGlyGluSerGly770775780AlaProGlyLeuProGlyIleAlaGlyProArgGlyGlyProGlyGlu785790795800ArgGlyGluHisGlyProProGlyProAlaGlyPheProGlyAlaPro805810815GlyGlnAsnGlyGluProGlyAlaLysGlyGluArgGlyAlaProGly820825830GluLysGlyGluGlyGlyProProGlyIleAlaGlyGlnProGlyGly835840845ThrGlyProProGlyProProGlyProGlnGlyValLysGlyGluArg850855860GlySerProGlyGlyProGlyAlaAlaGlyPheProGlyGlyArgGly865870875880LeuProGlyProProGlySerAsnGlyAsnProGlyProProGlySer885890895SerGlyProProGlyLysAspGlyProProGlyProProGlySerSer900905910GlyAlaProGlySerProGlyValSerGlyProLysGlyAspAlaGly915920925GlnProGlyGluLysGlySerProGlyProGlnGlyProProGlyAla930935940ProGlyProGlyGlyIleSerGlyIleThrGlyAlaArgGlyLeuAla945950955960GlyProProGlyMetProGlyAlaArgGlySerProGlyProGlnGly965970975ValLysGlyGluAsnGlyLysProGlyProSerGlyLeuAsnGlyGlu980985990ArgGlyProProGlyProGlnGlyLeuProGlyLeuAlaGlyAlaAla99510001005GlyGluProGlyArgAspGlyAsnProGlySerAspGlyLeuProGly101010151020ArgAspGlyAlaProGlySerLysGlyAspArgGlyGluAsnGlySer1025103010351040ProGlyAlaProGlyAlaProGlyHisProGlyProProGlyProVal104510501055GlyProAlaGlyLysAsnGlyAspArgGlyGluThrGlyProAlaGly106010651070ProAlaGlyAlaProGlyProAlaGlySerArgGlyAlaProGlyPro107510801085GlnGlyProArgGlyAspLysGlyGluThrGlyGluArgGlyAlaAsn109010951100GlyIleLysGlyHisArgGlyPheProGlyAsnProGlyAlaProGly1105111011151120SerProGlyProAlaGlyHisGlnGlyAlaValGlySerProGlyPro112511301135AlaGlyProArgGlyProValGlyProSerGlyProProGlyLysAsp114011451150GlyAlaSerGlyHisProGlyProIleGlyProProGlyProArgGly115511601165AsnArgGlyGluArgGlySerGluGlySerProGlyHisProGlyGln117011751180ProGlyProProGlyProProGlyAlaProGlyProCysCysGlyGly1185119011951200GlyAlaAlaAlaIleAlaGlyValGlyGlyGluLysAlaGlyGlyPhe120512101215AlaProTyrTyrGlyAspGluProMetAspPheLysIleAsnThrAsp122012251230GluIleMetThrSerLeuLysSerValAsnGlyGlnIleGluSerLeu123512401245IleSerProAspGlySerArgLysAsnProAlaArgAsnCysArgAsp125012551260LeuLysPheCysHisProGluLeuLysSerGlyGluTyrTrpValAsp1265127012751280ProAsnGlnGlyCysLysMetAspAlaIleLysValPheCysAsnMet128512901295GluThrGlyGluThrCysIleSerAlaSerProSerThrValProArg130013051310LysAsnTrpTrpThrAspSerGlyAlaGluLysLysTyrValTrpPhe131513201325GlyGluSerMetAsnGlyGlyPheGlnPheSerTyrGlyAsnProGlu133013351340LeuProGluAspValLeuAspValGlnLeuAlaPheLeuArgLeuLeu1345135013551360SerSerArgAlaSerGlnAsnIleThrTyrHisCysLysAsnSerIle136513701375AlaTyrMetGluHisAlaSerGlyAsnValLysLysAlaLeuArgLeu138013851390MetGlySerAsnGluGlyGluPheLysAlaGluGlyAsnSerLysPhe139514001405ThrTyrThrValLeuGluAspGlyCysThrLysHisThrGlyGluTrp141014151420GlyLysThrValPheGluTyrArgThrArgLysAlaValArgLeuPro1425143014351440IleValAspIleAlaProTyrAspIleGlyGlyProAspGlnGluPhe144514501455GlyAlaAspIleGlyProValCysPheLeu14601465<210>13<211>20<212>DNA<213>人(homosapiens)<400>13ccggctcctgctcctcttag20<210>14<211>20<212>DNA<213>人(homosapiens)<400>14gccaggagcaccagcaatac20<210>15<211>20<212>DNA<213>人(homosapiens)<400>15gctgatggacagcctggtgc20<210>16<211>20<212>DNA<213>人(homosapiens)<400>16gccctggaagaccagctgca20<210>17<211>20<212>DNA<213>人(homosapiens)<400>17cctggccttaagggaatgcc20<210>18<211>20<212>DNA<213>人(homosapiens)<400>18gcgccaggagaaccgtctcg20<210>19<211>20<212>DNA<213>人(homosapiens)<400>19ccgaaggttcccctggacga20<210>20<211>20<212>DNA<213>人(homosapiens)<400>20cggtcatgctctcgccgaac20<210>21<211>22<212>DNA<213>牛(bostaurus)<400>21ccccagttgtcttacggctatg22<210>22<211>22<212>DNA<213>牛(bostaurus)<400>22catagccgtaagacaactgggg22<210>23<211>19<212>DNA<213>牛(bostaurus)<400>23ggtagccccggtgaaaatg19<210>24<211>19<212>DNA<213>牛(bostaurus)<400>24cattttcaccggggctacc19<210>25<211>20<212>DNA<213>牛(bostaurus)<400>25gccccaagggtaacagcggt20<210>26<211>20<212>DNA<213>牛(bostaurus)<400>26accgctgttacccttggggc20<210>27<211>22<212>DNA<213>牛(bostaurus)<400>27tcctggccctgctggccccaaa22<210>28<211>22<212>DNA<213>牛(bostaurus)<400>28tttggggccagcagggccagga22<210>29<211>22<212>DNA<213>牛(bostaurus)<400>29tggacctaaaggtgctgctgga22<210>30<211>22<212>DNA<213>牛(bostaurus)<400>30tccagcagcacctttaggtcca22<210>31<211>20<212>DNA<213>牛(bostaurus)<400>31gaacagggtgttcctggaga20<210>32<211>20<212>DNA<213>牛(bostaurus)<400>32tctccaggaacaccctgttc20<210>33<211>18<212>DNA<213>牛(bostaurus)<400>33ggcaaagatggcgtccgt18<210>34<211>18<212>DNA<213>牛(bostaurus)<400>34acggacgccatctttgcc18<210>35<211>20<212>DNA<213>牛(bostaurus)<400>35gctaaaggcgaacctggcga20<210>36<211>20<212>DNA<213>牛(bostaurus)<400>36tcgccaggttcgcctttagc20<210>37<211>21<212>DNA<213>牛(bostaurus)<400>37gccggcaagagcggtgatcgt21<210>38<211>21<212>DNA<213>牛(bostaurus)<400>38acgatcaccgctcttgccggc21<210>39<211>19<212>DNA<213>牛(bostaurus)<400>39cgatggtggccgctactac19<210>40<211>19<212>DNA<213>牛(bostaurus)<400>40gtagtagcggccaccatcg19<210>41<211>23<212>DNA<213>牛(bostaurus)<400>41agagcatgaccgaagggcgaatt23<210>42<211>23<212>DNA<213>牛(bostaurus)<400>42aattcgcccttcggtcatgctct23<210>43<211>39<212>DNA<213>人(homosapiens)<400>43ttaattcctaggatgttcagctttgtggacctccggctc39<210>44<211>32<212>DNA<213>人(homosapiens)<400>44tgccactctgactggaagagtggagagtactg32<210>45<211>45<212>DNA<213>人(homosapiens)<400>45ttttccttttgcggccgcttacaggaagcagacagggccaacgtc45<210>46<211>30<212>DNA<213>牛(bostaurus)<400>46gtcatggtacctgaggccgttctgtacgca30<210>47<211>29<212>DNA<213>牛(bostaurus)<400>47acgtcatcgcacagcacgttgccgttgtc29<210>48<211>34<212>DNA<213>牛(bostaurus)<400>48aggacagtccttaagttcgtcgcagatcacgtca34<210>49<211>26<212>DNA<213>牛(bostaurus)<400>49agggaggccagctgttccaggcaatc26<210>50<211>27<212>DNA<213>牛(bostaurus)<400>50ccgaaggttcccctggacgagatggtt27<210>51<211>29<212>DNA<213>牛(bostaurus)<400>51cgtggtgacaagggtgagacaggcgaaca29<210>52<211>27<212>DNA<213>牛(bostaurus)<400>52cgggctgatgatgccaatgtggtccgt27<210>53<211>32<212>DNA<213>牛(bostaurus)<400>53aacatggaaaccggtgagacctgtgtataccc32<210>54<211>25<212>DNA<213>人(homosapiens)<400>54gacatgatgagctttgtgcaaaagg25<210>55<211>27<212>DNA<213>牛(bostaurus)<400>55tttggtttataaaaagcaaacagggcc27<210>56<211>24<212>DNA<213>人(homosapiens)<400>56tctcatgtctgatatttagacatg24<210>57<211>26<212>DNA<213>牛(bostaurus)<400>57ggactaatgaggctttctatttgtcc26<210>58<211>24<212>DNA<213>牛(bostaurus)<400>58ggcaccattcttaccaggctcacc24<210>59<211>22<212>DNA<213>牛(bostaurus)<400>59tgggtcccgctggcattcctgg22<210>60<211>23<212>DNA<213>牛(bostaurus)<400>60ccaggacaaccaggccctcctgg23<210>61<211>24<212>DNA<213>人(homosapiens)<400>61gacatgttcagctttgtggacctc24<210>62<211>20<212>DNA<213>野豬(susscrofa)<400>62agtttacaggaagcagacag20<210>63<211>24<212>DNA<213>人(homosapiens)<400>63ctacatgtctagggtctagacatg24<210>64<211>24<212>DNA<213>野豬(susscrofa)<400>64aggcgccaggctcgccaggctcac24<210>65<211>23<212>DNA<213>野豬(susscrofa)<400>65agttgtcttatggctatgatgag23<210>66<211>24<212>DNA<213>人(homosapiens)<400>66gacatgctcagctttgtggatacg24<210>67<211>23<212>DNA<213>野豬(susscrofa)<400>67agctggaccaggctcaccaacaa23<210>68<211>24<212>DNA<213>野豬(susscrofa)<400>68tggtgctaagggtgctgctggcct24<210>69<211>25<212>DNA<213>野豬(susscrofa)<400>69aggttcacccactgatccagcaaca25<210>70<211>25<212>DNA<213>野豬(susscrofa)<400>70tccctctggagagcctggtactgct25<210>71<211>25<212>DNA<213>野豬(susscrofa)<400>71tggaagtttgggttttaaacttccc25<210>72<211>21<212>DNA<213>人(homosapiens)<400>72acacaaggagtctgcatgtct2權(quán)利要求1.一種分離和純化的多肽,其特征在于,該多肽含有?;蜇i多肽,選自(i)α1(I)膠原、α2(I)膠原和α1(III)膠原;和(ii)(i)的片段和變體。2.一種分離和純化的多肽,其特征在于,該多肽是牛α1(I)膠原或其片段或變體。3.如權(quán)利要求2所述的多肽,其特征在于,所述多肽是單鏈。4.如權(quán)利要求2所述的多肽,其特征在于,所述多肽是同三聚的。5.如權(quán)利要求2所述的多肽,其特征在于,所述多肽是異三聚的。6.如權(quán)利要求2所述的多肽,其特征在于,所述多肽具有SEQIDNO2的氨基酸序列或其片段或變體。7.一種含有權(quán)利要求2所述的多肽的組合物。8.一種分離和純化的多核苷酸,其特征在于,該多核苷酸編碼牛α1(I)膠原或其片段或變體。9.一種與權(quán)利要求8所述的多核苷酸互補(bǔ)的分離和純化的多核苷酸。10.一種分離和純化的多核苷酸,其特征在于,該多核苷酸編碼SEQIDNO2或其片段或變體。11.一種含有權(quán)利要求8所述的多核苷酸的組合物。12.一種含有權(quán)利要求8所述的多核苷酸的表達(dá)載體。13.一種含有權(quán)利要求8所述的多核苷酸的宿主細(xì)胞。14.如權(quán)利要求13所述的宿主細(xì)胞,其特征在于,所述宿主細(xì)胞是原核宿主細(xì)胞。15.如權(quán)利要求13所述的宿主細(xì)胞,其特征在于,所述宿主細(xì)胞是真核宿主細(xì)胞。16.如權(quán)利要求13所述的宿主細(xì)胞,其特征在于,宿主細(xì)胞選自動物細(xì)胞、酵母細(xì)胞、植物細(xì)胞、昆蟲細(xì)胞和真菌細(xì)胞。17.一種含有權(quán)利要求8所述的多核苷酸的轉(zhuǎn)基因動物。18.一種含有權(quán)利要求8所述的多核苷酸的轉(zhuǎn)基因植物。19.一種產(chǎn)生牛α1(I)膠原的方法,其特征在于,該方法包括(a)在適合表達(dá)多肽的條件下培養(yǎng)權(quán)利要求13所述的宿主細(xì)胞;和(b)從宿主細(xì)胞培養(yǎng)物回收多肽。20.一種重組膠原,其特征在于,該膠原具有SEQIDNO2的氨基酸序列或其片段或變體。21.一種重組明膠,其特征在于,該明膠具有SEQIDNO2的氨基酸序列或其片段或變體。22.一種分離和純化的多肽,其特征在于,該多肽是牛α1(III)膠原或其片段或變體。23.一種分離和純化的多肽,其特征在于,該多肽是豬α1(I)膠原或其片段或變體。24.一種分離和純化的多肽,其特征在于,該多肽是豬α2(I)膠原或其片段或變體。25.一種分離和純化的多肽,其特征在于,該多肽是豬α1(III)膠原或其片段或變體。26.一種合成動物膠原的方法,其特征在于,該方法包括(a)在允許多核苷酸表達(dá)的條件下,在宿主細(xì)胞中引入至少一個含有編碼動物膠原或前膠原的多核苷酸序列的表達(dá)載體,和至少一個含有編碼翻譯后酶的多核苷酸序列的表達(dá)載體;和(b)分離動物膠原。27.如權(quán)利要求26所述的方法,其特征在于,所述翻譯后酶選自脯氨酰羥化酶、肽基脯氨?;悩?gòu)酶、膠原半乳糖苷基羥賴氨酰葡糖苷基轉(zhuǎn)移酶、羥賴氨酰半乳糖苷基轉(zhuǎn)移酶、C-蛋白酶、N-蛋白酶、賴氨酰羥化酶和賴氨酰氧化酶。28.如權(quán)利要求26所述的方法,其特征在于,所述翻譯后酶選自與動物膠原的同一物種。29.如權(quán)利要求26所述的方法,其特征在于,所述宿主細(xì)胞選自與動物膠原的同一物種。30.如權(quán)利要求26所述的方法,其特征在于,所述細(xì)胞不內(nèi)源性產(chǎn)生膠原。31.如權(quán)利要求26所述的方法,其特征在于,所述細(xì)胞不內(nèi)源性產(chǎn)生翻譯后酶。32.一種宿主細(xì)胞,其特征在于,該宿主細(xì)胞含有至少一個編碼動物膠原的表達(dá)載體和至少一個編碼翻譯后酶的表達(dá)載體。33.一種基本無任何其它類型的單一類型的重組動物膠原。34.如權(quán)利要求33所述的重組動物膠原,其特征在于,單一類型的膠原選自I型、II型、III型、IV型、V型、VI型、VII型、VIII型、IX型、X型、XI型、XII型、XIII型、XV型、XVI型、XVII型、IVIII型、XIX型和XX型膠原。35.一種產(chǎn)生重組動物明膠的方法,其特征在于,該方法包括(a)提供重組的動物膠原;和(b)從其衍生重組動物明膠。36.一種產(chǎn)生重組動物明膠的方法,該方法包括直接從改變的動物膠原構(gòu)建物產(chǎn)生重組動物明膠。全文摘要本發(fā)明提供了動物膠原和明膠及其組合物,以及它的生產(chǎn)方法。文檔編號C07K14/78GK1420892SQ00818241公開日2003年5月28日申請日期2000年11月10日優(yōu)先權(quán)日1999年11月12日發(fā)明者M(jìn)·P·貝爾,T·B·內(nèi)夫,J·W·波拉克,T·W·西利申請人:法布羅根股份有限公司