專利名稱:秀麗新桿線蟲中真核生物蛋白質(zhì)和核酸分子的生產(chǎn)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及秀麗新桿線蟲(Caenorhabditis elegans)中翻譯后修飾的真核生物蛋白質(zhì)和具體涉及人類蛋白質(zhì)的生產(chǎn)。本發(fā)明也包括翻譯后修飾的核酸分子如tRNA的生產(chǎn)。本發(fā)明進(jìn)一步包括用可鑒定的標(biāo)記如2H、13C、15N、硒代甲硫氨酸、硒代半胱氨酸或非天然氨基酸對表達(dá)的蛋白質(zhì)進(jìn)行共翻譯標(biāo)記。類似地,用2H、13C和15N對核酸分子進(jìn)行標(biāo)記。
背景有幾種在不同表達(dá)系統(tǒng)中生產(chǎn)真核生物蛋白質(zhì)的選擇。目前應(yīng)用下面的表達(dá)系統(tǒng)。
細(xì)菌許多大腸桿菌表達(dá)系統(tǒng)是商業(yè)上可購得的。一些例子為pET(Promega)、pQE(Qiagen)、pGEX(Amersham Pharmacia)、ptrcHIS(Invitrogen)、pDUAL(Stratagene)。大腸桿菌的優(yōu)點(diǎn)是價格低廉且易于應(yīng)用。主要的缺點(diǎn)是許多真核生物蛋白質(zhì)當(dāng)在大腸桿菌中表達(dá)時不能正確折疊并形成不溶性聚集體。密碼子選擇與高等真核生物的非常不同。真核生物蛋白質(zhì)常常必須在翻譯后進(jìn)行修飾,以能夠折疊為正確的結(jié)構(gòu)和/或變?yōu)榛罨摹4竽c桿菌不能進(jìn)行專由真核生物細(xì)胞進(jìn)行的復(fù)雜翻譯后修飾,如乙?;?、N-和O-連接的糖基化和?;土姿峄?br>
表達(dá)水平因蛋白質(zhì)不同而有巨大變化。1升大腸桿菌培養(yǎng)物中重組蛋白質(zhì)的產(chǎn)量一般為約10mg。在極少數(shù)情形中,可獲得每升大腸桿菌培養(yǎng)物中數(shù)百毫克重組蛋白質(zhì)的量。
酵母巴斯德畢赤氏酵母(Pichia pastoris)是公認(rèn)的表達(dá)重組蛋白質(zhì)的系統(tǒng)。幾個公司銷售相關(guān)的質(zhì)粒載體。例如,Invitrogen Corp.銷售pPIC質(zhì)粒系列。畢赤氏酵母屬的優(yōu)點(diǎn)是作為真核生物,其翻譯后修飾與那些發(fā)生于人類或高等真核生物中的更相似。畢赤氏酵母屬可容易且快速地進(jìn)行轉(zhuǎn)化。它也易于大規(guī)模培養(yǎng)。表達(dá)水平有相當(dāng)大的變化。已報(bào)道了高達(dá)12克/升的水平。
昆蟲細(xì)胞昆蟲細(xì)胞也可用于表達(dá)重組蛋白質(zhì)。幾個公司銷售相關(guān)的質(zhì)粒載體和細(xì)胞系。Invitrogen的系統(tǒng)為DES、InsectSelect和MaxBac。昆蟲細(xì)胞的優(yōu)點(diǎn)在于,作為多細(xì)胞真核生物,昆蟲比酵母更類似于人類。缺點(diǎn)為(i)昆蟲細(xì)胞比細(xì)菌或酵母細(xì)胞更難以培養(yǎng)和維持(ii)它們的培養(yǎng)更加昂貴(iii)它們需要無菌的培養(yǎng)箱(iv)表達(dá)水平比酵母或細(xì)菌系統(tǒng)的更低。
人類細(xì)胞系也可應(yīng)用人類細(xì)胞系,但它們需要生長因子以使其存活?,F(xiàn)今,人類生長因子是非常昂貴的,這使得人類細(xì)胞系成為如生產(chǎn)生長因子的不利候選物。
線蟲線蟲,即小的線蟲,是一枝迄今尚未開發(fā)用于大規(guī)模蛋白質(zhì)或核酸生產(chǎn)的真核生物。線蟲是非常簡單的動物,且自1949年以來已用作發(fā)育的模型系統(tǒng)(Dougherty EC和Nigon V.,J.Parasitol.(1949)35,11;Brenner S在1963年6月5日給Max Perutz的信中)。尤其是秀麗新桿線蟲中959個細(xì)胞中的每一個的發(fā)育均得到充分鑒定,且最近對其整個基因組進(jìn)行了測序并目前可供公眾使用(“The C.elegans Sequencing Consortium ”秀麗新桿線蟲的基因組序列研究生物學(xué)的一個平臺(Genome Sequence of the nematode C.elegansA platform for investigating biology).Science(1998)282,2012-2018)。線蟲是在遺傳上比細(xì)菌更與人類密切相關(guān)的真核生物,其蛋白質(zhì)的約60%與人類蛋白質(zhì)同源。
使得用作生產(chǎn)真核生物特別是人類蛋白質(zhì)的蛋白質(zhì)表達(dá)系統(tǒng)的線蟲引起關(guān)注的是如下事實(shí),即它們具有進(jìn)行翻譯后蛋白質(zhì)修飾所必需的機(jī)制。因此,在線蟲中生產(chǎn)的蛋白質(zhì)(肽藥物)事實(shí)上與天然的人類蛋白質(zhì)相同,且從而具有更低的不利副作用和更高的比活性,而需要更低的劑量。線蟲表達(dá)系統(tǒng)的其他優(yōu)點(diǎn)包括高的表達(dá)蛋白質(zhì)產(chǎn)量、低的維持成本、易于應(yīng)用及人們易于擴(kuò)大生產(chǎn)。
C.D.Link已描述了人類β-淀粉樣肽在轉(zhuǎn)基因秀麗新桿線蟲中的表達(dá),以生產(chǎn)與抗-β-淀粉樣多克隆和多克隆抗體免疫反應(yīng)的肌肉特異性沉積物(Link C.D.,人類β-淀粉樣肽在轉(zhuǎn)基因秀麗新桿線蟲中的表達(dá)(Expression of human beta-amyloid peptide in transgenicCaenorhabditis elegans),Proc.Natl.Acad.Sci.(1995)92,9368-9372),且他建議其無脊椎動物模型可用于體內(nèi)研究調(diào)節(jié)淀粉樣蛋白形成的因子。
國際專利申請WO 00/54815公開了通過應(yīng)用包含啟動子的表達(dá)載體而在秀麗新桿線蟲中表達(dá)DNA或蛋白質(zhì),該啟動子指導(dǎo)基因在秀麗新桿線蟲排泄細(xì)胞中的表達(dá)。蛋白質(zhì)表達(dá)的原因不是為了生產(chǎn)和分離蛋白質(zhì),而是為了發(fā)現(xiàn)參與細(xì)胞運(yùn)動性、細(xì)胞形狀和細(xì)胞向外生長過程的新分子,即藥物,并確定其功能。
發(fā)明描述本發(fā)明提供了一種生產(chǎn)真核生物如人類蛋白質(zhì)和核酸分子的體內(nèi)表達(dá)系統(tǒng),該表達(dá)系統(tǒng)易于操作、價格低廉、遺傳上穩(wěn)定且易于擴(kuò)大。本發(fā)明的線蟲表達(dá)系統(tǒng)適合于大規(guī)模生產(chǎn)超純的重組人類蛋白質(zhì)。生產(chǎn)的蛋白質(zhì)和核酸分子將含有高等生物(真核生物)所有典型的修飾,如乙?;?、N-和O-連接的糖基化和?;?、磷酸化及信號序列的切割等。這些修飾對于信號通路中醫(yī)藥上有用的蛋白質(zhì)的特異性是重要的。
新的線蟲蛋白質(zhì)表達(dá)系統(tǒng)組合了真核生物細(xì)胞的優(yōu)點(diǎn)如翻譯后修飾和已知大腸桿菌發(fā)酵操作的簡便性。
表達(dá)系統(tǒng)包含秀麗新桿線蟲。由于可同時注射入秀麗新桿線蟲中的不同質(zhì)粒的數(shù)目超過20,這使得能夠同時表達(dá)具有大復(fù)合物的例如不同亞基的多個質(zhì)粒,該大復(fù)合物含有蛋白質(zhì)和/或核酸。
應(yīng)用本發(fā)明可在工業(yè)規(guī)模上生產(chǎn)的真核生物蛋白質(zhì)的例子包括用于干細(xì)胞基礎(chǔ)研究和醫(yī)學(xué)應(yīng)用的人類生長因子、生長因子受體(膜結(jié)合的或可溶性部分),該醫(yī)學(xué)應(yīng)用如心臟病、糖尿病、癌癥和神經(jīng)系統(tǒng)疾病的基于干細(xì)胞的治療,該神經(jīng)系統(tǒng)疾病包括帕金森氏病和阿爾茨海默氏病。此外有單克隆抗體、G-蛋白、G-蛋白偶聯(lián)的受體和大的多亞基蛋白質(zhì)-RNA復(fù)合物,如聚合酶、端粒酶和剪接因子復(fù)合物。除潛在的醫(yī)學(xué)應(yīng)用之外,生產(chǎn)的蛋白質(zhì)和核酸可用于通過X-射線晶體學(xué)、電子晶體學(xué)或NMR對結(jié)構(gòu)進(jìn)行鑒定,其中人們可以研究翻譯后修飾的蛋白質(zhì)和核酸。秀麗新桿線蟲表達(dá)系統(tǒng)也可用于為了晶體學(xué)的應(yīng)用而用2H、13C、15N、Se-Met、Se-Cys或非天然氨基酸對真核生物蛋白質(zhì)進(jìn)行標(biāo)記,或者為了NMR實(shí)驗(yàn)用2H、13C或15N進(jìn)行標(biāo)記。
本發(fā)明的一個方面涉及用于在秀麗新桿線蟲中表達(dá)的質(zhì)粒載體,該載體以5’到3’的轉(zhuǎn)錄方向包含可操作地相互連接的熱激啟動子核苷酸序列;任選地含有用于在秀麗新桿線蟲和大腸桿菌之間有效穿梭的Shine-Dalgarno序列的合成內(nèi)含子核苷酸序列;任選的編碼核定位信號或分泌信號,如選自天然存在的信號序列的,如來自秀麗新桿線蟲的,或要進(jìn)行表達(dá)的蛋白質(zhì)或核酸分子的信號序列的核苷酸序列;編碼可識別的標(biāo)記的核苷酸序列;任選的編碼熒光蛋白質(zhì)的核苷酸序列;編碼蛋白酶切割位點(diǎn)的核苷酸序列;含有編碼真核生物如人類的蛋白質(zhì)或核酸分子的核苷酸序列的多克隆位點(diǎn)以及編碼翻譯終止的核苷酸序列。
可對質(zhì)粒中的核苷酸序列順序進(jìn)行更改,以使得多克隆位點(diǎn)之后為編碼蛋白酶切割位點(diǎn)的核苷酸序列、任選的編碼熒光蛋白質(zhì)的核苷酸序列、任選的編碼核定位信號或分泌信號的核苷酸序列和編碼可識別的標(biāo)記的核苷酸序列。
編碼蛋白酶切割位點(diǎn)的核苷酸序列的例子包括蛋白酶TEV、凝血酶和凝血因子Xa。
在質(zhì)粒載體的一個實(shí)施方案中,合成的內(nèi)含子核苷酸序列含有Shine-Dalgarno序列AGGAG,編碼核定位信號的核苷酸序列是SEQ IDNO3,編碼可識別的標(biāo)記的序列是編碼6-His標(biāo)記、10-His標(biāo)記或12-His標(biāo)記的序列,即使得在Ni螯合的柱上易于純化的6、10或12個組氨酸殘基,編碼熒光蛋白質(zhì)的核苷酸序列是編碼綠色熒光蛋白質(zhì)的具有SEQ ID NO8序列的核苷酸序列,編碼蛋白酶切割位點(diǎn)的核苷酸序列是編碼使得以后能夠切除6、10或12個組氨酸殘基的蛋白酶切割位點(diǎn)的序列。
在一個優(yōu)選實(shí)施方案中,缺乏編碼真核生物蛋白質(zhì)或核酸分子的核苷酸序列的質(zhì)粒具有核苷酸序列SEQ ID NO1。該質(zhì)粒不具有編碼核定位信號的核苷酸序列。人工的內(nèi)含子起始于480而終止于521(gtatgtttcga atgatactaa cataacatag aacattttca g),隨后為547~564的6-His-標(biāo)記序列(cat cac cat cac cat cac)和565~594的連接體序列,該連接體序列連接His-標(biāo)記與595~618的編碼TEV蛋白酶識別位點(diǎn)的序列。然后為單多克隆位點(diǎn)(MCS)(起始于619)。
在另一個優(yōu)選實(shí)施方案中,缺乏編碼真核生物蛋白質(zhì)或核酸分子的核苷酸序列的質(zhì)粒具有核苷酸序列SEQ ID NO2。人工的內(nèi)含子起始于480而終止于521(gtatgtttcga atgatactaa cataacatagaacattttca g),隨后為起始于位置533而終止于580的編碼核定位信號(NLS)的核苷酸序列(ctagtgctca gaaaaaatga ctgctccaaagaagaagcgt aaggtgcc)。在NLS后為588~605的6-His標(biāo)記序列(catcaccatc accatcac)。一個連接體序列(606~635)連接該標(biāo)記序列與636~656的編碼TEV蛋白酶識別位點(diǎn)的序列,其后為多克隆位點(diǎn)(起始于658)。
為了克隆的目的,用于質(zhì)粒中的NLS比基本的NLS DNA序列稍長。(將NLS克隆入用限制酶Nhe I和Nco I預(yù)先切割的質(zhì)粒中)?;镜腘LS序列(558~568ccaaagaagaagcgtaaggtgcc c,[最后的c來自Nco I切割的載體])翻譯為蛋白質(zhì)序列PKKKRKV,該序列可由核輸入機(jī)制識別。
核定位信號NLS由于下述原因而是有用的。當(dāng)對線蟲進(jìn)行熱激并以這樣的方式強(qiáng)制該線蟲超量生產(chǎn)需要的人類蛋白質(zhì)時,指導(dǎo)生產(chǎn)的蛋白質(zhì)進(jìn)入細(xì)胞核中是更安全的。這正是NLS所執(zhí)行的。將蛋白質(zhì)轉(zhuǎn)運(yùn)入核中的優(yōu)點(diǎn)是其中不存在蛋白酶。這些蛋白酶可以存在于細(xì)胞質(zhì)中,且尤其濃縮于稱作溶酶體的細(xì)胞器中。通過應(yīng)用NLS將表達(dá)的蛋白質(zhì)送入核內(nèi),它們被轉(zhuǎn)運(yùn)到與潛在危險(xiǎn)的蛋白酶有一定距離。
綠色熒光蛋白質(zhì)GFP的DNA序列在SEQ ID NO8中含有額外的3個內(nèi)含子。它主要用作發(fā)光標(biāo)記,以使得秀麗新桿線蟲表達(dá)預(yù)期的蛋白質(zhì)“可見”。在存在該DNA序列的質(zhì)粒中,該序列在6His-標(biāo)記之后如當(dāng)整合入質(zhì)粒SEQ ID NO1中時的6His-GFP-TEV-MCS,或如當(dāng)整合入質(zhì)粒SEQ ID NO2中時的NLS-6His-GFP-TEV-MCS。
在另一個優(yōu)選實(shí)施方案中,缺乏編碼真核生物蛋白質(zhì)或核酸分子的核苷酸序列的質(zhì)粒具有核苷酸序列SEQ ID NO9。相對于質(zhì)粒SEQ IDNO1中的序列對質(zhì)粒中序列的順序進(jìn)行了更改,并包括了具有序列SEQID NO8的綠色熒光蛋白質(zhì)。序列順序?yàn)镸CS-TEV-GFP-6His。
在另一個優(yōu)選實(shí)施方案中,缺乏編碼真核生物蛋白質(zhì)或核酸分子的核苷酸序列的質(zhì)粒具有核苷酸序列SEQ ID NO10。相對于質(zhì)粒SEQ IDNO2中的序列對質(zhì)粒中序列的順序進(jìn)行了更改,并包括了具有序列SEQID NO8的綠色熒光蛋白質(zhì)。序列順序?yàn)镸CS-TEV-GFP-NLS-6His。
在多克隆位點(diǎn)(MCS)后插入綠色熒光蛋白質(zhì)(GFP)使得可能快速檢查正確的蛋白質(zhì)折疊。如果表達(dá)的目標(biāo)蛋白質(zhì)如人類生長因子未正確折疊,這將使得其后的綠色熒光蛋白質(zhì)也不能正確折疊,從而人們不能看到綠色熒光。這是蛋白質(zhì)折疊的快速檢驗(yàn)。此外,通過根據(jù)公認(rèn)的GFP規(guī)程應(yīng)用離子交換層析或者作為應(yīng)用固定的抗-GFP抗體的親和標(biāo)記,可將GFP用作純化標(biāo)記。
本發(fā)明優(yōu)選的質(zhì)粒也計(jì)劃用于大腸桿菌中。因此將它們命名為“穿梭載體”。對上文中公開的質(zhì)粒序列的唯一修飾是使所謂的“Shine-Dalgarno”序列處于轉(zhuǎn)錄起始密碼子ATG前約10個核苷酸的中央。Shine-Dalgarno序列AGGAG是大腸桿菌的翻譯起始信號,而對秀麗新桿線蟲無影響。
因而,在質(zhì)粒SEQ ID NO1中,Shine-Dalgarno序列處于ATG-6His前10個核苷酸序列的中央;在質(zhì)粒SEQ ID NO2中,Shine-Dalgarno序列處于ATG-NLS前10個核苷酸序列的中央;而在質(zhì)粒SEQ ID NO9和10中,Shine-Dalgarno序列處于MCS(該MCS含有ATG)前10個核苷酸序列的中央。
質(zhì)粒SEQ ID NO1、2、9和10含有使大腸桿菌細(xì)菌對抗生素如氨芐青霉素或carbicillin或卡那霉素有抗性的蛋白質(zhì)。然而,這些蛋白質(zhì)對秀麗新桿線蟲無影響(如它們不向秀麗新桿線蟲提供任何抗生素抗性)。
在本發(fā)明最優(yōu)選的實(shí)施方案中,編碼人類蛋白質(zhì)的核苷酸序列是編碼人類生長因子蛋白質(zhì)的序列。一些人類生長因子蛋白質(zhì)的特定例子是稱作Wnt2b的生長因子序列SEQ ID NO4(智人(Homo sapiens)無翅型MMTV整合位點(diǎn)家族2B成員),稱作FGF10的生長因子序列SEQ ID NO5(智人角質(zhì)形成細(xì)胞生長因子2(FGF10)),稱作KLS的生長因子序列SEQ ID NO6(智人KIT配體可溶性組分),和稱作BMP10的生長因子序列SEQ ID NO7(智人骨形態(tài)發(fā)生蛋白10)。
本發(fā)明的另一個方面涉及在線蟲中生產(chǎn)真核生物如人類的蛋白質(zhì)或核酸分子的方法,該方法包含如下步驟,即,優(yōu)選地同時將根據(jù)本發(fā)明的一種或幾種質(zhì)粒載體注射入秀麗新桿線蟲雌雄同體的生殖腺中,于低于25℃的溫度在生長培養(yǎng)基中培養(yǎng)線蟲,隨后將培養(yǎng)溫度改變?yōu)?0和33℃之間的值,以在幾百個體細(xì)胞中誘導(dǎo)蛋白質(zhì)或核酸分子的表達(dá),在神經(jīng)元和表皮細(xì)胞中具有最高表達(dá)水平,并從該細(xì)胞中分離真核生物蛋白質(zhì)或核酸分子。
在本發(fā)明方法的一個實(shí)施方案中,生長培養(yǎng)基包含細(xì)菌如大腸桿菌作為線蟲的飼料。由于秀麗新桿線蟲可以專一地以分散在基本培養(yǎng)基中的細(xì)菌為食物,所以可利用該事實(shí)來標(biāo)記在秀麗新桿線蟲中生產(chǎn)的蛋白質(zhì)。通過向蟲子飼喂根據(jù)現(xiàn)有規(guī)程預(yù)先標(biāo)記的細(xì)菌(如用2H、13C、15N、Se-Met、Se-Cys或某些非天然氨基酸對蛋白質(zhì)的表達(dá)進(jìn)行標(biāo)記,及用2H、13C、15N對核酸分子的表達(dá)進(jìn)行標(biāo)記),各種標(biāo)記將摻入新生產(chǎn)的蛋白質(zhì)和核苷酸中。
在一個優(yōu)選實(shí)施方案中,在質(zhì)粒包括編碼核定位信號的核苷酸序列的情形中,可通過謹(jǐn)慎地打開線蟲的細(xì)胞而進(jìn)行分離,如通過應(yīng)用“珠攪拌器(bead beater)”(=充滿小的鋯珠的攪拌器)——從而使含有表達(dá)的蛋白質(zhì)或核酸分子的細(xì)胞核保持完整。這之后為分離細(xì)胞核,并通過溶解核膜以釋放表達(dá)的蛋白質(zhì),及將混合物進(jìn)行層析純化。對于蛋白質(zhì),這包括特異性地與可識別的標(biāo)記結(jié)合的固定相,如10-His-標(biāo)記的蛋白質(zhì)與填充入純化柱中的Ni-螯合的珠結(jié)合,隨后洗掉未結(jié)合的蛋白質(zhì),并在從柱中釋放真核生物如人類蛋白質(zhì)的條件下進(jìn)行洗脫,該條件如釋放10-His-標(biāo)記的蛋白質(zhì)的咪唑梯度。然后通過提供特異性的蛋白酶而切除可識別的標(biāo)記,該特異性的蛋白酶相應(yīng)于由所用質(zhì)粒編碼的蛋白酶切割位點(diǎn)并具有未切割的可識別標(biāo)記如6-His-標(biāo)記,同時,對從固定相釋放標(biāo)記的低濃度試劑進(jìn)行透析(如果用400-700mM咪唑進(jìn)行洗脫則適合應(yīng)用約10-50mM),將切割混合物轉(zhuǎn)移到新標(biāo)記特異性的柱子上,該切割混合物含有具切除標(biāo)記的真核生物蛋白質(zhì)和自身具有未切割的可識別標(biāo)記如6-His-標(biāo)記的蛋白酶,洗脫柱子以獲得含有真核生物蛋白質(zhì)的洗脫液,而留下切除的可識別標(biāo)記如10-His標(biāo)記和可識別標(biāo)記的如6-His-標(biāo)記的蛋白酶結(jié)合于固定相上。
在另一個優(yōu)選實(shí)施方案中,在質(zhì)粒缺乏編碼核定位信號的核苷酸序列的情形中,可通過搗碎線蟲而進(jìn)行分離,以釋放表達(dá)的真核生物蛋白質(zhì),并將混合物進(jìn)行層析純化,該層析純化具有特異性地與可識別的標(biāo)記結(jié)合的固定相,隨后進(jìn)行洗滌及在從固定相中釋放真核生物蛋白質(zhì)的條件下進(jìn)行洗脫,如在前述段落中示例的。
在所用質(zhì)粒缺乏核定位信號的情形中,或者在需要防止真核生物蛋白質(zhì)受到存在于細(xì)胞中的非特異性蛋白酶攻擊的額外預(yù)防情形中,如對于蛋白質(zhì)是降解敏感性的情形,保護(hù)表達(dá)的蛋白質(zhì)抗蛋白酶降解的可選擇的或補(bǔ)充途徑是注射獨(dú)立的質(zhì)粒,如缺乏編碼蛋白酶切割位點(diǎn)的核苷酸序列和含有編碼通用蛋白酶抑制劑如α2-巨球蛋白(α2-M)的核苷酸序列SEQ ID NO11的SEQ ID NO1或2。
因而,在本發(fā)明方法額外優(yōu)選的實(shí)施方案中,該方法包含額外注射質(zhì)粒載體以共表達(dá)通用的蛋白酶抑制劑,該質(zhì)粒載體包含可操作地相互連接的熱激啟動子核苷酸序列;任選地含有Shine-Dalgarno序列的合成內(nèi)含子核苷酸序列;任選的編碼核定位信號的核苷酸序列;編碼可識別的標(biāo)記的核苷酸序列;任選的編碼熒光蛋白質(zhì)的核苷酸序列;編碼通用蛋白酶抑制劑的核苷酸序列,如編碼α2-巨球蛋白的通用蛋白酶抑制劑SEQ ID NO11;以及編碼翻譯終止的核苷酸序列。在該情形中,可識別的標(biāo)記仍然位于表達(dá)的通用蛋白酶抑制劑上,且它將與標(biāo)記特異性的柱子結(jié)合(在第二個和最后一個特異性柱步驟中連同(如6-His-)標(biāo)記的蛋白酶和從真核生物蛋白酶中切除的(如10-His-)標(biāo)記一起)。
秀麗新桿線蟲表達(dá)系統(tǒng),包括質(zhì)粒及在本發(fā)明的線蟲中生產(chǎn)真核生物如人類蛋白質(zhì)或核酸分子的方法特別適合于大規(guī)模生產(chǎn)超純的重組真核生物蛋白質(zhì),特別是人類生長因子。生產(chǎn)的蛋白質(zhì)將含有高等生物(真核生物)典型的修飾,如乙?;?、N-和O-連接的糖基化和酰化、磷酸化及信號序列的切割等。這些修飾對于信號通路中醫(yī)藥上有用的蛋白質(zhì)的特異性是重要的??蓱?yīng)用本發(fā)明在工業(yè)規(guī)模上生產(chǎn)的人類(真核生物)蛋白質(zhì)的例子包括用于干細(xì)胞基礎(chǔ)研究和醫(yī)學(xué)應(yīng)用的人類生長因子、生長因子受體(膜結(jié)合的或可溶性部分)。此外有單克隆抗體、G-蛋白、G-蛋白偶聯(lián)受體。特別地,該系統(tǒng)設(shè)計(jì)為能夠在秀麗新桿線蟲和大腸桿菌之間進(jìn)行穿梭,以研究翻譯后修飾的作用。它也使得能夠通過用預(yù)先標(biāo)記的細(xì)菌飼喂線蟲而用可鑒定的標(biāo)記(如2H、13C、15N、Se-Met、Se-Cys等)對秀麗新桿線蟲生產(chǎn)的蛋白質(zhì)和核酸分子進(jìn)行標(biāo)記以進(jìn)行NMR和X-射線晶體學(xué)研究。此外,秀麗新桿線蟲中真核生物蛋白質(zhì)如人類蛋白質(zhì)或核酸分子的表達(dá)也可依賴于選擇的信號肽而導(dǎo)向于細(xì)胞核保護(hù)性的蛋白酶降低的環(huán)境中或細(xì)胞的某些區(qū)室中。該系統(tǒng)也使得如果需要大的多亞基蛋白質(zhì)-RNA復(fù)合物如聚合酶、端粒酶和剪接因子復(fù)合物的重建,則能夠同時從超過20個質(zhì)粒中表達(dá)蛋白質(zhì)。
本發(fā)明現(xiàn)在將進(jìn)一步通過實(shí)驗(yàn)描述進(jìn)行闡明,且應(yīng)理解為權(quán)利要求的范圍不受任何特定敘述的細(xì)節(jié)的限制。
實(shí)驗(yàn)對秀麗新桿線蟲進(jìn)行的所有操作均應(yīng)用Methods in Cell Biology第84卷中“秀麗新桿線蟲生物的現(xiàn)代生物學(xué)分析(Caenorhabditiselegansmodern biological analysis of an organism)”(Epstein和Shakes編,Academic Press,1995)中的技術(shù),或應(yīng)用在此處描述的方法的小的修改。
通過將質(zhì)粒DNA連同編碼unc-36(+)和hmp-1(+)的質(zhì)粒一起注射入基因型為unc-36(e251);hmp-1(zu278)/daf-11(m8ts)sma-1(e30)的蟲子中而構(gòu)建了轉(zhuǎn)基因秀麗新桿線蟲品系(Costa等人,Journal of Cell Biology 141297-308 1998)。hmp-1(zu278)導(dǎo)致了胚胎致死表型(Costa等人,1998)。確立了基因型為unc-36(e251);hmp-1(zu278);svEx[unc-36(+)hmp-1(+)hs-gen-1(+)]的品系,其中“gen-1”指編碼人類生長因子的基因。
應(yīng)用公認(rèn)的程序?qū)⑾x子在33℃熱激2小時。(Stringham EG和Candido,EPM,Environmental Toxicology and Chemistry131211-1220 1994)。
表達(dá)載體構(gòu)建為了在秀麗新桿線蟲中表達(dá)蛋白質(zhì),我們已基于質(zhì)粒pPD49、78-umu、SEQ ID NO1、2、9和10構(gòu)建了4個質(zhì)粒載體,這使得基因能夠在許多不同細(xì)胞中進(jìn)行熱誘導(dǎo)型表達(dá)。載體含有用于異位表達(dá)外源蛋白質(zhì)的秀麗新桿線蟲熱激啟動子。該啟動子在低于25℃時是無活性的。然而,將培養(yǎng)溫度改變?yōu)?0和33℃之間的值導(dǎo)致在幾百個體細(xì)胞中誘導(dǎo)蛋白質(zhì)高水平的表達(dá),在神經(jīng)元和表皮細(xì)胞中具有最高表達(dá)水平。
設(shè)計(jì)載體以制備翻譯融合物。ATG的下游是質(zhì)粒SEQ ID NO1和2中編碼6-His-標(biāo)記的序列,其后為TEV蛋白酶切割位點(diǎn)和多克隆位點(diǎn)。
微注射和選擇為了確定單個蛋白質(zhì)的表達(dá)水平,我們制備了幾個質(zhì)粒,其中每一個均含有不同的檢驗(yàn)基因及單獨(dú)的質(zhì)粒的適當(dāng)遺傳選擇標(biāo)記。
我們將質(zhì)粒連同編碼unc-36(+)和hmp-1(+)的質(zhì)粒一起注射入基因型為unc-36(e251);hmp-1(zu278)/daf-11(m8ts)sma-1(e30)的雌雄同體中。hmp-1(zu278)導(dǎo)致了胚胎致死表型(Costa等人,1998)。確立了基因型為unc-36(e251);hmp-1(zu278);svEx[unc-36(+)hmp-1(+)hs-gen-1(+)]的品系,其中“gen-1”指要檢驗(yàn)的基因。
超過600bp的不同質(zhì)粒之間的重組發(fā)生于體內(nèi),并獲得了轉(zhuǎn)化的第一代F1子代,其中不同注射的質(zhì)粒一起形成附加體(稱作染色體外陣列)。10個F1轉(zhuǎn)化體中約有1個產(chǎn)生穩(wěn)定的品系,其中染色體外陣列不變地從一代傳遞到下一代。染色體外陣列是相對穩(wěn)定有絲分裂的,從而在任何轉(zhuǎn)化的動物中,大多數(shù)細(xì)胞含有該陣列。通過應(yīng)用適當(dāng)?shù)木幋a基本基因的共注射標(biāo)記,可能獲得如下品系,其中群體中的所有成體和幼蟲均含有該陣列。
蛋白質(zhì)表達(dá)秀麗新桿線蟲在20℃溫度控制的搖床上的錐形瓶中的液體培養(yǎng)基中進(jìn)行培養(yǎng)。該液體生長培養(yǎng)基含有緩慢生長的大腸桿菌株OP50,線蟲以該品系為飼料。培養(yǎng)蟲子7日,其后將培養(yǎng)溫度從20℃改變?yōu)?3℃而誘導(dǎo)熱激啟動子控制的蛋白質(zhì)生產(chǎn)。
1升初始培養(yǎng)物中培養(yǎng)的濕蟲子的產(chǎn)量為約10g。綠色熒光蛋白質(zhì)(GFP)在約25%的細(xì)胞中表達(dá),并導(dǎo)致在熒光光學(xué)顯微鏡下可見的熒光信號。
10~20g培養(yǎng)的和誘導(dǎo)的蟲子中純蛋白質(zhì)的產(chǎn)量約為0.2~1.0mg。
稱作Wnt2b的人類生長因子(智人無翅型MMTV整合位點(diǎn)家族2B成員)成功表達(dá)于蟲子中,該生長因子來自在多克隆位點(diǎn)包含核苷酸序列SEQ ID NO4的質(zhì)粒SEQ ID NO1。
簡言之,線蟲是在簡單的液體培養(yǎng)基中培養(yǎng)的。它們生長于發(fā)酵罐或錐形瓶中。蟲子具有約2-3日的世代時間,且成體蟲子生長至約1mm長。每一個雌雄同體每世代生產(chǎn)約300-500只卵。它們可在-80℃重復(fù)的長時間貯藏。在向雌雄同體的生殖腺中注射高達(dá)20個不同質(zhì)粒后可選擇穩(wěn)定的品系。
序列表<110>Sauer,Uwe H.
Tuck,Simon<120>秀麗新桿線蟲中真核生物蛋白質(zhì)和核酸分子的生產(chǎn).
<130>110068601<140>
<141>
<160>11<170>PatentIn Ver.2.1<210>1<211>3914<212>DNA<213>人工序列<220>
<223>人工序列說明修飾的質(zhì)粒<400>1atgaccatga ttacgccaag cttgcatgcc tgcaggtcga ctctagagga tcaagagcat 60ttgaatcaga atatggagaa cggagcatga gcattttcga agttttttag atgcactaga 120acaaagcgtg ttggcttcct ctgagcccgc tttccttata tacccgcatt ctgcagcctt 180acagaatgtt ctagaaggtc ctagatgcat tcgtttgaaa atactcccgg tgggtgcaaa 240gagacgcaga cggaaaatgt atctgggtct ctttattgtg tacactactt ttccatgtac 300cgaatgtgag tcgccctcct tttgcaacaa gcagctcgaa tgttctagaa aaaggtggaa 360aatagtataa ataccgttga aaataaatac cgaacaacat ttgctctaat tgtgaaatta 420gaaatcttca aactataatc atctcactgg atccccggga ttggccaaag gacccaaagg 480tatgtttcga atgatactaa cataacatag aacattttca ggaggacctt ggctagcaaa 540atgaaacatc accatcacca tcaccccatg agcgattacg acatccccac tactgagaat 600ctttattttc agggcgccat gggcgccagg cctcgagata tcgatgatca gatctggtac 660caagctccgc atcggccgct gtcatcagat cgccatctcg cgcccgtgcc tctgacttct 720aagtccaatt actcttcaac atccctacat gctctttctc cctgtgctcc caccccctat 780ttttgttatt atcaaaaaaa cttcttctta atttctttgt tttttagctt cttttaagtc 840acctctaaca atgaaattgt gtagattcaa aaatagaatt aattcgtaat aaaaagtcga 900aaaaaattgt gctccctccc cccattaata ataattctat cccaaaatct acacaatgtt 960ctgtgtacac ttcttatgtt ttttttactt ctgataaatt ttttttgaaa catcatagaa 1020aaaaccgcac acaaaatacc ttatcatatg ttacgtttca gtttatgacc gcaattttta 1080tttcttcgca cgtctgggcc tctcatgacg tcaaatcatg ctcatcgtga aaaagttttg 1140gagtattttt ggaatttttc aatcaagtga aagtttatga aattaatttt cctgcttttg 1200ctttttgggg gtttccccta ttgtttgtca agagtttcga ggacggcgtt tttcttgcta 1260aaatcacaag tattgatgag cacgatgcaa gaaagatcgg aagaaggttt gggtttgagg 1320ctcagtggaa ggtgagtaga agttgataat ttgaaagtgg agtagtgtct atggggtttt 1380
tgccttaaat gacagaatac attcccaata taccaaacat aactgtttcc tactagtcgg 1440ccgtacgggc cctttcgtct cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg 1500cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag acaagcccgt 1560cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc ttaactatgc ggcatcagag 1620cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga 1680aaataccgca tcaggcggcc ttaagggcct cgtgatacgc ctatttttat aggttaatgt 1740catgataata atggtttctt agacgtcagg tggcactttt cggggaaatg tgcgcggaac 1800ccctatttgt ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc 1860ctgataaatg cttcaataat attgaaaaag gaagagtatg agtattcaac atttccgtgt 1920cgcccttatt cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct 1980ggtgaaagta aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga 2040tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa gaacgttttc caatgatgag 2100cacttttaaa gttctgctat gtggcgcggt attatcccgt attgacgccg ggcaagagca 2160actcggtcgc cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga 2220aaagcatctt acggatggca tgacagtaag agaattatgc agtgctgcca taaccatgag 2280tgataacact gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc 2340ttttttgcac aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa 2400tgaagccata ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg caacaacgtt 2460gcgcaaacta ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg 2520gatggaggcg gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt 2580tattgctgat aaatctggag ccggtgagcg tgggtctcgc ggtatcattg cagcactggg 2640gccagatggt aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat 2700ggatgaacga aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact 2760gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt tttaatttaa 2820aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt 2880ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 2940ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 3000tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 3060gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt 3120agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga 3180taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc 3240gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact 3300gagataccta cagcgtgagc attgagaaag cgccacgctt cccgaaggga gaaaggcgga 3360caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 3420aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 3480tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 3540acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga 3600ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac 3660gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcccaatac gcaaaccgcc 3720tctccccgcg cgttggccga ttcattaatg cagctggcac gacaggtttc ccgactggaa 3780agcgggcagt gagcgcaacg caattaatgt gagttagctc actcattagg caccccaggc 3840tttacacttt atgcttccgg ctcgtatgtt gtgtggaatt gtgagcggat aacaatttca 3900cacaggaaac agct 3914<210>2<211>3955<212>DNA
<213>人工序列<220>
<223>人工序列說明修飾的質(zhì)粒<400>2atgaccatga ttacgccaag cttgcatgcc tgcaggtcga ctctagagga tcaagagcat 60ttgaatcaga atatggagaa cggagcatga gcattttcga agttttttag atgcactaga 120acaaagcgtg ttggcttcct ctgagcccgc tttccttata tacccgcatt ctgcagcctt 180acagaatgtt ctagaaggtc ctagatgcat tcgtttgaaa atactcccgg tgggtgcaaa 240gagacgcaga cggaaaatgt atctgggtct ctttattgtg tacactactt ttccatgtac 300cgaatgtgag tcgccctcct tttgcaacaa gcagctcgaa tgttctagaa aaaggtggaa 360aatagtataa ataccgttga aaataaatac cgaacaacat ttgctctaat tgtgaaatta 420gaaatcttca aactataatc atctcactgg atccccggga ttggccaaag gacccaaagg 480tatgtttcga atgatactaa cataacatag aacattttca ggaggacctt ggctagtgct 540cagaaaaaat gactgctcca aagaagaagc gtaaggtgcc catgaaacat caccatcacc 600atcaccccat gagcgattac gacatcccca ctactgagaa tctttatttt cagggcgcca 660tgggcgccag gcctcgagat atcgatgatc agatctggta ccaagctccg catcggccgc 720tgtcatcaga tcgccatctc gcgcccgtgc ctctgacttc taagtccaat tactcttcaa 780catccctaca tgctctttct ccctgtgctc ccacccccta tttttgttat tatcaaaaaa 840acttcttctt aatttctttg ttttttagct tcttttaagt cacctctaac aatgaaattg 900tgtagattca aaaatagaat taattcgtaa taaaaagtcg aaaaaaattg tgctccctcc 960ccccattaat aataattcta tcccaaaatc tacacaatgt tctgtgtaca cttcttatgt 1020tttttttact tctgataaat tttttttgaa acatcataga aaaaaccgca cacaaaatac 1080cttatcatat gttacgtttc agtttatgac cgcaattttt atttcttcgc acgtctgggc 1140ctctcatgac gtcaaatcat gctcatcgtg aaaaagtttt ggagtatttt tggaattttt 1200caatcaagtg aaagtttatg aaattaattt tcctgctttt gctttttggg ggtttcccct 1260attgtttgtc aagagtttcg aggacggcgt ttttcttgct aaaatcacaa gtattgatga 1320gcacgatgca agaaagatcg gaagaaggtt tgggtttgag gctcagtgga aggtgagtag 1380aagttgataa tttgaaagtg gagtagtgtc tatggggttt ttgccttaaa tgacagaata 1440cattcccaat ataccaaaca taactgtttc ctactagtcg gccgtacggg ccctttcgtc 1500tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 1560cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 1620ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 1680accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcggc 1740cttaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 1800tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 1860taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 1920tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 1980gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 2040gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 2100cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 2160tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac 2220tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 2280atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 2340ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 2400gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 2460gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 2520
gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 2580gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 2640gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 2700cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 2760atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 2820tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 2880ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 2940gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 3000tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 3060ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 3120ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 3180gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 3240ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 3300tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 3360cattgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 3420agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 3480agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 3540gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 3600tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 3660accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 3720gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg 3780attcattaat gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac 3840gcaattaatg tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg 3900gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagct 3955<210>3<211>48<212>DNA<213>猿猴病毒40<400>3ctagtgctca gaaaaaatga ctgctccaaa gaagaagcgt aaggtgcc 48<210>4<211>2013<212>DNA<213>智人(Homo sapiens)<400>4aaaccctgaa gagcccaagc aatgtggttg taaaatttgc aaaataagat taaatcttaa 60ctgcaatctg ttaacactgc tgtctccttt cactctttct cctatatcac actttcccac 120atgttggatg gccttggagt ggtagccata agcatttttg gaattcaact aaaaactgaa 180ggatccttga ggacggcagt acctggcata cctacacagt cagcgttcaa caagtgtttg 240caaaggtaca ttggggcact gggggcacga gtgatctgtg acaatatccc tggtttggtg 300agccggcagc ggcagctgtg ccagcgttac ccagacatca tgcgttcagt gggcgagggt 360gcccgagaat ggatccgaga gtgtcagcac caattccgcc accaccgctg gaactgtacc 420
accctggacc gggaccacac cgtctttggc cgtgtcatgc tcagaagtag ccgagaggca 480gcttttgtat atgccatctc atcagcaggg gtagtccacg ctattactcg cgcctgtagc 540cagggtgaac tgagtgtgtg cagctgtgac ccctacaccc gtggccgaca ccatgaccag 600cgtggggact ttgactgggg tggctgcagt gacaacatcc actacggtgt ccgttttgcc 660aaggccttcg tggatgccaa ggagaagagg cttaaggatg cccgggccct catgaactta 720cataataacc gctgtggtcg cacggctgtg cggcggtttc tgaagctgga gtgtaagtgc 780catggcgtga gtggttcctg tactctgcgc acctgctggc gtgcactctc agatttccgc 840cgcacaggtg attacctgcg gcgacgctat gatggggctg tgcaggtgat ggccacccaa 900gatggtgcca acttcaccgc agcccgccaa ggctatcgcc gtgccacccg gactgatctt 960gtctactttg acaactctcc agattactgt gtcttggaca aggctgcagg ttccctaggc 1020actgcaggcc gtgtctgcag caagacatca aaaggaacag acggttgtga aatcatgtgc 1080tgtggccgag ggtacgacac aactcgagtc acccgtgtta cccagtgtga gtgcaaattc 1140cactggtgct gtgctgtacg gtgcaaggaa tgcagaaata ctgtggacgt ccatacttgc 1200aaagccccca agaaggcaga gtggctggac caaacctgaa cacacagata cctcactcat 1260ccctccaatt caagcctctc aactcaaaag cacaagatcc ttgcatgcac accttcctcc 1320accctccacc ctgggctgct accgcttcta tttaaggatg tagagagtaa tccataggga 1380ccatggtgtc ctggctggtt ccttagccct gggaaggagt tgtcagggga tataagaaac 1440tgagcaagct ccctgatttc ccgctctgga gatttgaagg gagagtagaa gagatagggg 1500gtctttagag tgaaatgagt tgcactaaag tacgtagttg aggctccttt tttctttcct 1560ttgcaccagc ttcccgatac ttcttggtgt gcaagaggaa gggtacctgt agagagcttc 1620tttttgtttc tacctggcca aagttagatg ggacaaagat gaatggcatg tcccttctct 1680gaagtccgtt tgagcagaac tacctggtac cccgaaagaa aatcttaggc taccacattc 1740tattattgag agcctgagat gttagccata gtggacaagg ttccattcac atgctcatat 1800gtttataaac tgtgttttgt agaagaaaaa gaatcataac aatacaaaca cacattcatt 1860ctctcttttt ctctctacca ttctcaacct gtattggaca gcactgcctc ttttgcttac 1920ttgctgcctg ttcaaactga ggtggaatgc agtggttccc atgcttaaca aatcattaaa 1980acaccctaga acactcctag gatagattaa tgt 2013<210>5<211>1584<212>DNA<213>智人<400>5ggggagagga agagtggtag ggggagggag agagagagga agagtttcca aacttgtctc 60cagtgacagg agacatttac gttccacaag ataaaactgc cacttagagc ccagggaagc 120taaaccttcc tggcttggcc taggagctcg agcggagtca tgggctctct ggtcctgaca 180ctgtgcgctc ttttctgcct ggcagcttac ttggtttctg gcagccccat catgaaccta 240gagcagtctc ctctggaaga agatatgtcc ctctttggtg atgttttctc agagcaagac 300ggtgtcgact ttaacacact gctccagagc atgaaggatg agtttcttaa gacactaaac 360ctctctgaca tccccacgca ggattcagcc aaggtggacc caccagagta catgttggaa 420ctctacaaca aatttgcaac agatcggacc tccatgccct ctgccaacat cattaggagt 480ttcaagaatg aagatctgtt ttcccagccg gtcagtttta atgggctccg aaaatacccc 540ctcctcttca atgtgtccat tcctcaccat gaagaggtca tcatggctga acttaggcta 600tacacactgg tgcaaaggga tcgtatgata tacgatggag tagaccggaa aattaccatt 660tttgaagtgc tggagagcaa aggggataat gagggagaaa gaaacatgct ggtcttggtg 720tctggggaga tatatggaac caacagtgag tgggagactt ttgatgtcac agatgccatc 780
agacgttggc aaaagtcagg ctcatccacc caccagctgg aggtccacat tgagagcaaa 840cacgatgaag ctgaggatgc cagcagtgga cggctagaaa tagataccag tgcccagaat 900aagcataacc ctttgctcat cgtgttttct gatgaccaaa gcagtgacaa ggagaggaag 960gaggaactga atgaaatgat ttcccatgag caacttccag agctggacaa cttgggcctg 1020gatagctttt ccagtggacc tggggaagag gctttgttgc agatgagatc aaacatcatc 1080tatgactcca ctgcccgaat cagaaggaac gccaaaggaa actactgtaa gaggaccccg 1140ctctacatcg acttcaagga gattgggtgg gactcctgga tcatcgctcc gcctggatac 1200gaagcctatg aatgccgtgg tgtttgtaac taccccctgg cagagcatct cacacccaca 1260aagcatgcaa ttatccaggc cttggtccac ctcaagaatt cccagaaagc ttccaaagcc 1320tgctgtgtgc ccacaaagct agagcccatc tccatcctct atttagacaa aggcgtcgtc 1380acctacaagt ttaaatacga aggcatggcc gtctccgaat gtggctgtag atagaagaag 1440agtcctatgg cttatttaat aactgtaaat gtgtatattt ggtgttccta tttaatgaga 1500ttatttaata agggtgtaca gtaatagagg cttgctgcct tcaggaaatg gacaggtcag 1560tttgttgtag gaaatgcata tttt1584<210>6<211>889<212>DNA<213>智人<400>6cagtggagag ggcgctgcgc tcgggctacc caatgcgtgg actatctgcc gccgctgttc 60gtgcaatatg ctggagctcc agaacagcta aacggagtcg ccacaccact gtttgtgctg 120gatcgcagcg ctgcctttcc ttatgaagaa gacacaaact tggattctca cttgcattta 180tcttcagctg ctcctattta atcctctcgt caaaactgaa gggatctgca ggaatcgtgt 240gactaataat gtaaaagacg tcactaaatt ggtggcaaat cttccaaaag actacatgat 300aaccctcaaa tatgtccccg ggatggatgt tttgccaagt cattgttgga taagcgagat 360ggtagtacaa ttgtcagaca gcttgactga tcttctggac aagttttcaa atatttctga 420aggcttgagt aattattcca tcatagacaa acttgtgaat atagtggatg accttgtgga 480gtgcgtgaaa gaaaactcat ctaaggatct aaaaaaatca ttcaagagcc cagaacccag 540gctctttact cctgaagaat tctttagaat ttttaataga tccattgatg ccttcaagga 600ctttgtagtg gcatctgaaa ctagtgattg tgtggtttct tcaacattaa gtcctgagaa 660agggaaggcc aaaaatcccc ctggagactc cagcctacac tgggcagcca tggcattgcc 720agcattgttt tctcttataa ttggctttgc ttttggagcc ttatactgga agaagagaca 780gccaagtctt acaagggcag ttgaaaatat acaaattaat gaagaggata atgagataag 840tatgttgcaa gagaaagaga gagagtttca agaagtgtaa ttgtggctt 889<210>7<211>627<212>DNA<213>智人<400>7atgtggaaat ggatactgac acattgtgcc tcagcctttc cccacctgcc cggctgctgc 60tgctgctgct ttttgttgct gttcttggtg tcttccgtcc ctgtcacctg ccaagccctt 120ggtcaggaca tggtgtcacc agaggccacc aactcttctt cctcctcctt ctcctctcct 180
tccagcgcgg gaaggcatgt gcggagctac aatcaccttc aaggagatgt ccgctggaga 240aagctattct ctttcaccaa gtactttctc aagattgaga agaacgggaa ggtcagcggg 300accaagaagg agaactgccc gtacagcatc ctggagataa catcagtaga aatcggagct 360gttgccgtca aagccattaa cagcaactat tacttagcca ggaacaagaa ggggaaactc 420tatggctcaa aagaatttaa caatgactgt aagctgaagg agaggataga ggaaaatgga 480tacaatacct atgcatcatt taactggcag cataatggga ggcaaatgta tgtggcattg 540aatggaaaag gagctccaag gagaggacag aaaacacgaa ggaaaaacac ctctgctcac 600tttcttccaa tggtggtaca ctcatag 627<210>8<211>870<212>DNA<213>人工序列<220>
<223>人工序列說明綠色熒光蛋白編碼序列<400>8atgagtaaag gagaagaact tttcactgga gttgtcccaa ttcttgttga attagatggt 60gatgttaatg ggcacaaatt ttctgtcagt ggagagggtg aaggtgatgc aacatacgga 120aaacttaccc ttaaatttat ttgcactact ggaaaactac ctgttccatg ggtaagttta 180aacatatata tactaactaa ccctgattat ttaaattttc agccaacact tgtcactact 240ttctgttatg gtgttcaatg cttctcgaga tacccagatc atatgaaacg gcatgacttt 300ttcaagagtg ccatgcccga aggttatgta caggaaagaa ctatattttt caaagatgac 360gggaactaca agacacgtaa gtttaaacag ttcggtacta actaaccata catatttaaa 420ttttcaggtg ctgaagtcaa gtttgaaggt gatacccttg ttaatagaat cgagttaaaa 480ggtattgatt ttaaagaaga tggaaacatt cttggacaca aattggaata caactataac 540tcacacaatg tatacatcat ggcagacaaa caaaagaatg gaatcaaagt tgtaagttta 600aacttggact tactaactaa cggattatat ttaaattttc agaacttcaa aattagacac 660aacattgaag atggaagcgt tcaactagca gaccattatc aacaaaatac tccaattggc 720gatggccctg tccttttacc agacaaccat tacctgtcca cacaatctgc cctttcgaaa 780gatcccaacg aaaagagaga ccacatggtc cttcttgagt ttgtaacagc tgctgggatt 840acacatggca tggatgaact atacaaatag 870<210>9<211>4718<212>DNA<213>人工序列<220>
<223>人工序列說明修飾的質(zhì)粒<400>9atgaccatga ttacgccaag cttgcatgcc tgcaggtcga ctctagagga tcaagagcat 60ttgaatcaga atatggagaa cggagcatga gcattttcga agttttttag atgcactaga 120acaaagcgtg ttggcttcct ctgagcccgc tttccttata tacccgcatt ctgcagcctt 180
acagaatgtt ctagaaggtc ctagatgcat tcgtttgaaa atactcccgg tgggtgcaaa 240gagacgcaga cggaaaatgt atctgggtct ctttattgtg tacactactt ttccatgtac 300cgaatgtgag tcgccctcct tttgcaacaa gcagctcgaa tgttctagaa aaaggtggaa 360aatagtataa ataccgttga aaataaatac cgaacaacat ttgctctaat tgtgaaatta 420gaaatcttca aactataatc atctcactgg atccccggga ttggccaaag gacccaaagg 480tatgtttcga atgatactaa cataacatag aacattttca ggaggaccct tggctagcga 540attcaaaatg atatcagaga atctttattt tcagggcagt aaaggagaag aacttttcac 600tggagttgtc ccaattcttg ttgaattaga tggtgatgtt aatgggcaca aattttctgt 660cagtggagag ggtgaaggtg atgcaacata cggaaaactt acccttaaat ttatttgcac 720tactggaaaa ctacctgttc catgggtaag tttaaacata tatatactaa ctaaccctga 780ttatttaaat tttcagccaa cacttgtcac tactttctgt tatggtgttc aatgcttctc 840gagataccca gatcatatga aacggcatga ctttttcaag agtgccatgc ccgaaggtta 900tgtacaggaa agaactatat ttttcaaaga tgacgggaac tacaagacac gtaagtttaa 960acagttcggt actaactaac catacatatt taaattttca ggtgctgaag tcaagtttga 1020aggtgatacc cttgttaata gaatcgagtt aaaaggtatt gattttaaag aagatggaaa 1080cattcttgga cacaaattgg aatacaacta taactcacac aatgtataca tcatggcaga 1140caaacaaaag aatggaatca aagttgtaag tttaaacttg gacttactaa ctaacggatt 1200atatttaaat tttcagaact tcaaaattag acacaacatt gaagatggaa gcgttcaact 1260agcagaccat tatcaacaaa atactccaat tggcgatggc cctgtccttt taccagacaa 1320ccattacctg tccacacaat ctgccctttc gaaagatccc aacgaaaaga gagaccacat 1380ggtccttctt gagtttgtaa cagctgctgg gattacacat ggcatggatg aactatacaa 1440acatcaccat caccatcact aatgagagct ccgcatcggc cgctgtcatc agatcgccat 1500ctcgcgcccg tgcctctgac ttctaagtcc aattactctt caacatccct acatgctctt 1560tctccctgtg ctcccacccc ctatttttgt tattatcaaa aaaacttctt cttaatttct 1620ttgtttttta gcttctttta agtcacctct aacaatgaaa ttgtgtagat tcaaaaatag 1680aattaattcg taataaaaag tcgaaaaaaa ttgtgctccc tccccccatt aataataatt 1740ctatcccaaa atctacacaa tgttctgtgt acacttctta tgtttttttt acttctgata 1800aatttttttt gaaacatcat agaaaaaacc gcacacaaaa taccttatca tatgttacgt 1860ttcagtttat gaccgcaatt tttatttctt cgcacgtctg ggcctctcat gacgtcaaat 1920catgctcatc gtgaaaaagt tttggagtat ttttggaatt tttcaatcaa gtgaaagttt 1980atgaaattaa ttttcctgct tttgcttttt gggggtttcc cctattgttt gtcaagagtt 2040tcgaggacgg cgtttttctt gctaaaatca caagtattga tgagcacgat gcaagaaaga 2100tcggaagaag gtttgggttt gaggctcagt ggaaggtgag tagaagttga taatttgaaa 2160gtggagtagt gtctatgggg tttttgcctt aaatgacaga atacattccc aatataccaa 2220acataactgt ttcctactag tcggccgtac gggccctttc gtctcgcgcg tttcggtgat 2280gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg tctgtaagcg 2340gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc 2400tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat gcggtgtgaa 2460ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc ggccttaagg gcctcgtgat 2520acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt caggtggcac 2580ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac attcaaatat 2640gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag 2700tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc 2760tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc 2820acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc 2880cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc 2940ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt 3000ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt 3060
atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat 3120cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct 3180tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat 3240gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc 3300ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg 3360ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc 3420tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta 3480cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc 3540ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac tttagattga 3600tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg ataatctcat 3660gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat 3720caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa 3780accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa 3840ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt agccgtagtt 3900aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt 3960accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata 4020gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt 4080ggagcgaacg acctacaccg aactgagata cctacagcgt gagcattgag aaagcgccac 4140gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga 4200gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg 4260ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa 4320aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat 4380gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 4440tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 4500agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg 4560gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta 4620gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg 4680aattgtgagc ggataacaat ttcacacagg aaacagct 4718<210>10<211>4754<212>DNA<213>人工序列<220>
<223>人工序列說明修飾的質(zhì)粒<400>10atgaccatga ttacgccaag cttgcatgcc tgcaggtcga ctctagagga tcaagagcat 60ttgaatcaga atatggagaa cggagcatga gcattttcga agttttttag atgcactaga 120acaaagcgtg ttggcttcct ctgagcccgc tttccttata tacccgcatt ctgcagcctt 180acagaatgtt ctagaaggtc ctagatgcat tcgtttgaaa atactcccgg tgggtgcaaa 240gagacgcaga cggaaaatgt atctgggtct ctttattgtg tacactactt ttccatgtac 300cgaatgtgag tcgccctcct tttgcaacaa gcagctcgaa tgttctagaa aaaggtggaa 360aatagtataa ataccgttga aaataaatac cgaacaacat ttgctctaat tgtgaaatta 420gaaatcttca aactataatc atctcactgg atccccggga ttggccaaag gacccaaagg 480tatgtttcga atgatactaa cataacatag aacattttca ggaggaccct tggctagcga 540
attcaaaatg atatcagaga atctttattt tcagggcagt aaaggagaag aacttttcac 600tggagttgtc ccaattcttg ttgaattaga tggtgatgtt aatgggcaca aattttctgt 660cagtggagag ggtgaaggtg atgcaacata cggaaaactt acccttaaat ttatttgcac 720tactggaaaa ctacctgttc catgggtaag tttaaacata tatatactaa ctaaccctga 780ttatttaaat tttcagccaa cacttgtcac tactttctgt tatggtgttc aatgcttctc 840gagataccca gatcatatga aacggcatga ctttttcaag agtgccatgc ccgaaggtta 900tgtacaggaa agaactatat ttttcaaaga tgacgggaac tacaagacac gtaagtttaa 960acagttcggt actaactaac catacatatt taaattttca ggtgctgaag tcaagtttga 1020aggtgatacc cttgttaata gaatcgagtt aaaaggtatt gattttaaag aagatggaaa 1080cattcttgga cacaaattgg aatacaacta taactcacac aatgtataca tcatggcaga 1140caaacaaaag aatggaatca aagttgtaag tttaaacttg gacttactaa ctaacggatt 1200atatttaaat tttcagaact tcaaaattag acacaacatt gaagatggaa gcgttcaact 1260agcagaccat tatcaacaaa atactccaat tggcgatggc cctgtccttt taccagacaa 1320ccattacctg tccacacaat ctgccctttc gaaagatccc aacgaaaaga gagaccacat 1380ggtccttctt gagtttgtaa cagctgctgg gattacacat ggcatggatg aactatacaa 1440aactgctcca aagaagaagc gtaaggtgcc catgaaacat caccatcacc atcactaatg 1500agagctccgc atcggccgct gtcatcagat cgccatctcg cgcccgtgcc tctgacttct 1560aagtccaatt actcttcaac atccctacat gctctttctc cctgtgctcc caccccctat 1620ttttgttatt atcaaaaaaa cttcttctta atttctttgt tttttagctt cttttaagtc 1680acctctaaca atgaaattgt gtagattcaa aaatagaatt aattcgtaat aaaaagtcga 1740aaaaaattgt gctccctccc cccattaata ataattctat cccaaaatct acacaatgtt 1800ctgtgtacac ttcttatgtt ttttttactt ctgataaatt ttttttgaaa catcatagaa 1860aaaaccgcac acaaaatacc ttatcatatg ttacgtttca gtttatgacc gcaattttta 1920tttcttcgca cgtctgggcc tctcatgacg tcaaatcatg ctcatcgtga aaaagttttg 1980gagtattttt ggaatttttc aatcaagtga aagtttatga aattaatttt cctgcttttg 2040ctttttgggg gtttccccta ttgtttgtca agagtttcga ggacggcgtt tttcttgcta 2100aaatcacaag tattgatgag cacgatgcaa gaaagatcgg aagaaggttt gggtttgagg 2160ctcagtggaa ggtgagtaga agttgataat ttgaaagtgg agtagtgtct atggggtttt 2220tgccttaaat gacagaatac attcccaata taccaaacat aactgtttcc tactagtcgg 2280ccgtacgggc cctttcgtct cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg 2340cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag acaagcccgt 2400cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc ttaactatgc ggcatcagag 2460cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga 2520aaataccgca tcaggcggcc ttaagggcct cgtgatacgc ctatttttat aggttaatgt 2580catgataata atggtttctt agacgtcagg tggcactttt cggggaaatg tgcgcggaac 2640ccctatttgt ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc 2700ctgataaatg cttcaataat attgaaaaag gaagagtatg agtattcaac atttccgtgt 2760cgcccttatt cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct 2820ggtgaaagta aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga 2880tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa gaacgttttc caatgatgag 2940cacttttaaa gttctgctat gtggcgcggt attatcccgt attgacgccg ggcaagagca 3000actcggtcgc cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga 3060aaagcatctt acggatggca tgacagtaag agaattatgc agtgctgcca taaccatgag 3120tgataacact gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc 3180ttttttgcac aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa 3240tgaagccata ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg caacaacgtt 3300gcgcaaacta ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg 3360gatggaggcg gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt 3420
tattgctgat aaatctggag ccggtgagcg tgggtctcgc ggtatcattg cagcactggg 3480gccagatggt aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat 3540ggatgaacga aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact 3600gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt tttaatttaa 3660aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt 3720ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 3780ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 3840tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 3900gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt 3960agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga 4020taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc 4080gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact 4140gagataccta cagcgtgagc attgagaaag cgccacgctt cccgaaggga gaaaggcgga 4200caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 4260aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 4320tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 4380acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga 4440ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac 4500gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcccaatac gcaaaccgcc 4560tctccccgcg cgttggccga ttcattaatg cagctggcac gacaggtttc ccgactggaa 4620agcgggcagt gagcgcaacg caattaatgt gagttagctc actcattagg caccccaggc 4680tttacacttt atgcttccgg ctcgtatgtt gtgtggaatt gtgagcggat aacaatttca 4740cacaggaaac agct 4754<210>11<211>4425<212>DNA<213>智人<400>11atggggaaga acaaactcct tcatccaagt ctggttcttc tcctcttggt cctcctgccc 60acagacgcct cagtctctgg aaaaccgcag tatatggttc tggtcccctc cctgctccac 120actgagacca ctgagaaggg ctgtgtcctt ctgagctacc tgaatgagac agtgactgta 180agtgcttcct tggagtctgt caggggaaac aggagcctct tcactgacct ggaggcggag 240aatgacgtac tccactgtgt cgccttcgct gtcccaaagt cttcatccaa tgaggaggta 300atgttcctca ctgtccaagt gaaaggacca acccaagaat ttaagaagcg gaccacagtg 360atggttaaga acgaggacag tctggtcttt gtccagacag acaaatcaat ctacaaacca 420gggcagacag tgaaatttcg tgttgtctcc atggatgaaa actttcaccc cctgaatgag 480ttgattccac tagtatacat tcaggatccc aaaggaaatc gcatcgcaca atggcagagt 540ttccagttag agggtggcct caagcaattt tcttttcccc tctcatcaga gcccttccag 600ggctcctaca aggtggtggt acagaagaaa tcaggtggaa ggacagagca ccctttcacc 660gtggaggaat ttgttcttcc caagtttgaa gtacaagtaa cagtgccaaa gataatcacc 720atcttggaag aagagatgaa tgtatcagtg tgtggcctat acacatatgg gaagcctgtc 780cctggacatg tgactgtgag catttgcaga aagtatagtg acgcttccga ctgccacggt 840gaagattcac aggctttctg tgagaaattc agtggacagc taaacagcca tggctgcttc 900tatcagcaag taaaaaccaa ggtcttccag ctgaagagga aggagtatga aatgaaactt 960cacactgagg cccagatcca agaagaagga acagtggtgg aattgactgg aaggcagtcc 1020
agtgaaatca caagaaccat aaccaaactc tcatttgtga aagtggactc acactttcga 1080cagggaattc ccttctttgg gcaggtgcgc ctagtagatg ggaaaggcgt ccctatacca 1140aataaagtca tattcatcag aggaaatgaa gcaaactatt actccaatgc taccacggat 1200gagcatggcc ttgtacagtt ctctatcaac accaccaacg ttatgggtac ctctcttact 1260gttagggtca attacaagga tcgtagtccc tgttacggct accagtgggt gtcagaagaa 1320cacgaagagg cacatcacac tgcttatctt gtgttctccc caagcaagag ctttgtccac 1380cttgagccca tgtctcatga actaccctgt ggccatactc agacagtcca ggcacattat 1440attctgaatg gaggcaccct gctggggctg aagaagctct ccttttatta tctgataatg 1500gcaaagggag gcattgtccg aactgggact catggactgc ttgtgaagca ggaagacatg 1560aagggccatt tttccatctc aatccctgtg aagtcagaca ttgctcctgt cgctcggttg 1620ctcatctatg ctgttttacc taccggggac gtgattgggg attctgcaaa atatgatgtt 1680gaaaattgtc tggccaacaa ggtggatttg agcttcagcc catcacaaag tctcccagcc 1740tcacacgccc acctgcgagt cacagcggct cctcagtccg tctgcgccct ccgtgctgtg 1800gaccaaagcg tgctgctcat gaagcctgat gctgagctct cggcgtcctc ggtttacaac 1860ctgctaccag aaaaggacct cactggcttc cctgggcctt tgaatgacca ggacgatgaa 1920gactgcatca atcgtcataa tgtctatatt aatggaatca catatactcc agtatcaagt 1980acaaatgaaa aggatatgta cagcttccta gaggacatgg gcttaaaggc attcaccaac 2040tcaaagattc gtaaacccaa aatgtgtcca cagcttcaac agtatgaaat gcatggacct 2100gaaggtctac gtgtaggttt ttatgagtca gatgtaatgg gaagaggcca tgcacgcctg 2160gtgcatgttg aagagcctca cacggagacc gtacgaaagt acttccctga gacatggatc 2220tgggatttgg tggtggtaaa ctcagcaggg gtggctgagg taggagtaac agtccctgac 2280accatcaccg agtggaaggc aggggccttc tgcctgtctg aagatgctgg acttggtatc 2340tcttccactg cctctctccg agccttccag cccttctttg tggagcttac aatgccttac 2400tctgtgattc gtggagaggc cttcacactc aaggccacgg tcctaaacta ccttcccaaa 2460tgcatccggg tcagtgtgca gctggaagcc tctcccgcct tccttgctgt cccagtggag 2520aaggaacaag cgcctcactg catctgtgca aacgggcggc aaactgtgtc ctgggcagta 2580accccaaagt cattaggaaa tgtgaatttc actgtgagcg cagaggcact agagtctcaa 2640gagctgtgtg ggactgaggt gccttcagtt cctgaacacg gaaggaaaga cacagtcatc 2700aagcctctgt tggttgaacc tgaaggacta gagaaggaaa caacattcaa ctccctactt 2760tgtccatcag gtggtgaggt ttctgaagaa ttatccctga aactgccacc aaatgtggta 2820gaagaatctg cccgagcttc tgtctcagtt ttgggagaca tattaggctc tgccatgcaa 2880aacacacaaa atcttctcca gatgccctat ggctgtggag agcagaatat ggtcctcttt 2940gctcctaaca tctatgtact ggattatcta aatgaaacac agcagcttac tccagaggtc 3000aagtccaagg ccattggcta tctcaacact ggttaccaga gacagttgaa ctacaaacac 3060tatgatggct cctacagcac ctttggggag cgatatggca ggaaccaggg caacacctgg 3120ctcacagcct ttgttctgaa gacttttgcc caagctcgag cctacatctt catcgatgaa 3180gcacacatta cccaagccct catatggctc tcccagaggc agaaggacaa tggctgtttc 3240aggagctctg ggtcactgct caacaatgcc ataaagggag gagtagaaga tgaagtgacc 3300ctctccgcct atatcaccat cgcccttctg gagattcctc tcacagtcac tcaccctgtt 3360gtccgcaatg ccctgttttg cctggagtca gcctggaaga cagcacaaga aggggaccat 3420ggcagccatg tatataccaa agcactgctg gcctatgctt ttgccctggc aggtaaccag 3480gacaagagga aggaagtact caagtcactt aatgaggaag ctgtgaagaa agacaactct 3540gtccattggg agcgccctca gaaacccaag gcaccagtgg ggcattttta cgaaccccag 3600gctccctctg ctgaggtgga gatgacatcc tatgtgctcc tcgcttatct cacggcccag 3660ccagccccaa cctcggagga cctgacctct gcaaccaaca tcgtgaagtg gatcacgaag 3720cagcagaatg cccagggcgg tttctcctcc acccaggaca cagtggtggc tctccatgct 3780ctgtccaaat atggagccgc cacatttacc aggactggga aggctgcaca ggtgactatc 3840cagtcttcag ggacattttc cagcaaattc caagtggaca acaacaatcg cctgttactg 3900
cagcaggtct cattgccaga gctgcctggg gaatacagca tgaaagtgac aggagaagga 3960tgtgtctacc tccagacctc cttgaaatac aatattctcc cagaaaagga agagttcccc 4020tttgctttag gagtgcagac tctgcctcaa acttgtgatg aacccaaagc ccacaccagc 4080ttccaaatct ccctaagtgt cagttacaca gggagccgct ctgcctccaa catggcgatc 4140gttgatgtga agatggtctc tggcttcatt cccctgaagc caacagtgaa aatgcttgaa 4200agatctaacc atgtgagccg gacagaagtc agcagcaacc atgtcttgat ttaccttgat 4260aaggtgtcaa atcagacact gagcttgttc ttcacggttc tgcaagatgt cccagtaaga 4320gatctcaaac cagccatagt gaaagtctat gattactacg agacggatga gtttgcaatc 4380gctgagtaca atgctccttg cagcaaagat cttggaaatg cttga 442權(quán)利要求
1.用于在秀麗新桿線蟲中表達(dá)的質(zhì)粒載體,該載體以5’到3’的轉(zhuǎn)錄方向包含可操作地相互連接的熱激啟動子核苷酸序列;任選地含有Shine-Dalgarno序列的合成內(nèi)含子核苷酸序列;任選的編碼核定位信號或分泌信號的核苷酸序列;編碼可識別的標(biāo)記的核苷酸序列;任選的編碼熒光蛋白質(zhì)的核苷酸序列;編碼蛋白酶切割位點(diǎn)的核苷酸序列;含有編碼真核生物如人類的蛋白質(zhì)或核酸分子的核苷酸序列的多克隆位點(diǎn)以及編碼翻譯終止的核苷酸序列。
2.權(quán)利要求1的質(zhì)粒載體,其中對核苷酸序列順序進(jìn)行更改,以使得多克隆位點(diǎn)之后為編碼蛋白酶切割位點(diǎn)的核苷酸序列、任選的編碼熒光蛋白質(zhì)的核苷酸序列、任選的編碼核定位信號或分泌信號的核苷酸序列和編碼可識別的標(biāo)記的核苷酸序列。
3.權(quán)利要求1或2的質(zhì)粒載體,其中合成的內(nèi)含子核苷酸序列含有Shine-Dalgarno序列AGGAG,編碼核定位信號的核苷酸序列是SEQID NO3,編碼可識別的標(biāo)記的序列是編碼6-His、10-His或12-His標(biāo)記的序列,編碼熒光蛋白質(zhì)的核苷酸序列是編碼綠色熒光蛋白質(zhì)的具有序列SEQ ID NO8的核苷酸序列,編碼蛋白酶切割位點(diǎn)的核苷酸序列是編碼TEV蛋白酶切割位點(diǎn)的序列。
4.權(quán)利要求1或3的質(zhì)粒載體,其中缺乏編碼真核生物蛋白質(zhì)或核酸分子的核苷酸序列的質(zhì)粒具有核苷酸序列SEQ ID NO1。
5.權(quán)利要求1或3的質(zhì)粒載體,其中缺乏編碼真核生物蛋白質(zhì)或核酸分子的核苷酸序列的質(zhì)粒具有核苷酸序列SEQ ID NO2。
6.權(quán)利要求2或3的質(zhì)粒載體,其中缺乏編碼真核生物蛋白質(zhì)或核酸分子的核苷酸序列的質(zhì)粒具有核苷酸序列SEQ ID NO9。
7.權(quán)利要求2或3的質(zhì)粒載體,其中缺乏編碼真核生物蛋白質(zhì)或核酸分子的核苷酸序列的質(zhì)粒具有核苷酸序列SEQ ID NO10。
8.權(quán)利要求1-7中任何一項(xiàng)的質(zhì)粒載體,其中編碼真核生物蛋白質(zhì)的核苷酸序列是編碼人類生長因子蛋白質(zhì)的序列。
9.權(quán)利要求8的質(zhì)粒載體,其中編碼人類生長因子蛋白質(zhì)的序列選自SEQ ID NO4、SEQ ID NO5、SEQ ID NO6和SEQ ID NO7。
10.在線蟲中生產(chǎn)真核生物如人類的蛋白質(zhì)或核酸分子的方法,該方法包含如下步驟,即,將一種或幾種權(quán)利要求1-9中任何一項(xiàng)的質(zhì)粒載體注射入秀麗新桿線蟲雌雄同體的生殖腺中,于低于25℃的溫度在生長培養(yǎng)基中培養(yǎng)線蟲,隨后將培養(yǎng)溫度改變?yōu)?0和33℃之間的值,以在幾百個體細(xì)胞中誘導(dǎo)蛋白質(zhì)或核酸分子的表達(dá),在神經(jīng)元和表皮細(xì)胞中具有最高表達(dá)水平,并從該細(xì)胞中分離真核生物蛋白質(zhì)或核酸分子。
11.權(quán)利要求10的方法,其中生長培養(yǎng)基包含任選地進(jìn)行標(biāo)記的細(xì)菌作為線蟲的飼料。
12.權(quán)利要求11的方法,其中用可鑒定標(biāo)記對細(xì)菌進(jìn)行標(biāo)記,對于蛋白質(zhì)的表達(dá),該標(biāo)記選自2H、13C、15N、Se-Met、Se-Cys和非天然氨基酸,對于核酸分子的表達(dá),該標(biāo)記選自2H、13C、15N的可鑒定標(biāo)記。
13.權(quán)利要求10的方法,其中在質(zhì)粒包括編碼核定位信號的核苷酸序列的情形中,可通過謹(jǐn)慎地打開線蟲以打開含有表達(dá)的蛋白質(zhì)的細(xì)胞而進(jìn)行分離,從而使細(xì)胞核保持完整,隨后分離細(xì)胞核,并溶解核膜以釋放表達(dá)的蛋白質(zhì)或核酸分子,及將混合物進(jìn)行層析純化,該純化對于蛋白質(zhì)包括特異性地與可識別的標(biāo)記結(jié)合的固定相,隨后進(jìn)行洗滌,并在通過提供特異性蛋白酶而從可識別的標(biāo)記蛋白釋放真核生物蛋白質(zhì)的條件下進(jìn)行洗脫,該特異性蛋白酶相應(yīng)于由所用質(zhì)粒編碼的蛋白酶切割位點(diǎn)且具有未切割的可識別標(biāo)記,同時,對從固定相釋放標(biāo)記的低濃度試劑進(jìn)行透析,將切割混合物轉(zhuǎn)移到新標(biāo)記特異性的柱子上,該切割混合物含有具切除標(biāo)記的真核生物蛋白質(zhì)和具有未切割的可識別標(biāo)記的蛋白酶,洗脫柱子以獲得含有真核生物蛋白質(zhì)的洗脫液,而留下切除的可識別標(biāo)記和含有可識別標(biāo)記的蛋白酶結(jié)合于固定相上。
14.權(quán)利要求10的方法,其中在質(zhì)粒缺乏編碼核定位信號的核苷酸序列的情形中,通過搗碎線蟲而進(jìn)行分離,以釋放表達(dá)的蛋白質(zhì)或核酸分子,并將混合物進(jìn)行層析純化,該層析純化對于蛋白質(zhì)包括特異性地與可識別的標(biāo)記結(jié)合的固定相,隨后進(jìn)行洗滌及在從固定相中釋放真核生物蛋白質(zhì)的條件下進(jìn)行洗脫。
15.權(quán)利要求10-14中任何一項(xiàng)的方法,該方法包含額外注射質(zhì)粒載體以共表達(dá)通用的蛋白酶抑制劑,該質(zhì)粒載體包含可操作地相互連接的熱激啟動子核苷酸序列;任選地含有Shine-Dalgarno序列的合成內(nèi)含子核苷酸序列;任選的編碼核定位信號的核苷酸序列;編碼可識別的標(biāo)記的核苷酸序列;任選的編碼熒光蛋白質(zhì)的核苷酸序列;編碼通用蛋白酶抑制劑的核苷酸序列,以及編碼翻譯終止的核苷酸序列。
16.權(quán)利要求15的方法,其中編碼通用蛋白酶抑制劑的核苷酸序列是編碼α2-巨球蛋白的SEQ ID NO11。
全文摘要
描述了一種秀麗新桿線蟲中的質(zhì)粒表達(dá)載體,該載體具有熱誘導(dǎo)型啟動子核苷酸序列、任選地含有用于在秀麗新桿線蟲和大腸桿菌之間有效穿梭的Shine-Dalgarno序列的合成內(nèi)含子核苷酸序列、任選的編碼核定位信號或分泌信號的核苷酸序列、編碼可識別的標(biāo)記的核苷酸序列、任選的編碼熒光蛋白質(zhì)的核苷酸序列、編碼蛋白酶切割位點(diǎn)的核苷酸序列、含有編碼真核生物如人類的蛋白質(zhì)或核酸分子的核苷酸序列的多克隆位點(diǎn)以及編碼翻譯終止的核苷酸序列。也描述了在線蟲中特別大規(guī)模地生產(chǎn)真核生物如人類的蛋白質(zhì)和核酸分子的方法。該方法包含將一種或幾種不同的質(zhì)粒載體注射入秀麗新桿線蟲雌雄同體的生殖腺中,于低于25℃的溫度在生長培養(yǎng)基中培養(yǎng)線蟲,任選地包含作為線蟲飼料的標(biāo)記的細(xì)菌,隨后改變?yōu)?0-33℃,以在幾百個體細(xì)胞中誘導(dǎo)真核生物蛋白質(zhì)或核酸分子的表達(dá),在神經(jīng)元和表皮細(xì)胞中具有最高表達(dá)水平,并從該細(xì)胞中分離真核生物蛋白質(zhì)或核酸分子。
文檔編號C12P21/02GK1617930SQ02827596
公開日2005年5月18日 申請日期2002年11月26日 優(yōu)先權(quán)日2001年11月27日
發(fā)明者烏韋·H·索爾, 西蒙·塔克 申請人:內(nèi)克西特股份有限公司