本發(fā)明屬于基因工程領(lǐng)域,具體涉及一種提高哺乳動物細(xì)胞中外源基因表達水平的基因片段、重組載體及其用途。
背景技術(shù):
中國倉鼠卵巢細(xì)胞(cho)是生物制藥中最常用的哺乳動物細(xì)胞,是外源真核基因的最佳表達系統(tǒng)之一,在生物制藥中被廣泛應(yīng)用,目前已經(jīng)上市和正在進行臨床研究的基因工程藥物中大約有60-70%為哺乳動物細(xì)胞表達產(chǎn)品,而cho細(xì)胞表達產(chǎn)品占其中的絕大部分。與原核表達系統(tǒng)比較具有如下優(yōu)點:外源蛋白容易在cho細(xì)胞中合成并分泌到培養(yǎng)基中;重組蛋白的折疊與修飾、理化性質(zhì)、生物學(xué)性質(zhì)幾乎與天然蛋白相同;能正確組裝多亞基蛋白;能大規(guī)模高密度無血清培養(yǎng)。但是,與原核、酵母表達系統(tǒng)相比其表達量低難以大量制備一直是該表達系統(tǒng)的問題,特別是臨床使用劑量達到數(shù)十至數(shù)百毫克級乃至克級水平的生物工程藥物的應(yīng)用,提高表達量就成了直關(guān)重要的問題。
啟動子的強弱直接關(guān)系到外源基因在宿主細(xì)胞中的表達水平,為提高外源基因的轉(zhuǎn)錄效率,必須盡可能的選用高活性的啟動子。目前在真核細(xì)胞中最常用的啟動子為人的cmv啟動子,它有比較廣泛的宿主細(xì)胞,也是比較強的啟動子。但是研究發(fā)現(xiàn),該啟動子內(nèi)存在cpg島容易導(dǎo)致沉默效應(yīng);僅在細(xì)胞周期的s期起作用,因此尋找比cmv更好的啟動子是必要的。人們一直在尋找,高強度適應(yīng)性廣的啟動子,kalwys用鼠的mcmv啟動子在cho-k1細(xì)胞中表達egfp,是人的cmv啟動子的3倍,但在表達抗體這樣的蛋白時,表達能力卻比較弱不如人的cmv啟動子。gershontj等通過人工設(shè)計合成了一個能夠增加基因表達的核心啟動子,體內(nèi)外研究表明:它比cmv核心啟動子顯著性提高報告基因熒光素酶的表達水平,這就為尋找高活性啟動子提供了另一種思路,有可能創(chuàng)造出自然界不存在的高強度的人工啟動子。probiogen公司,克隆了細(xì)胞內(nèi)廣泛存在的啟動子,強度比cmv強,非細(xì)胞周期依賴,能夠?qū)够虺聊?,在?xì)胞中穩(wěn)定表達50代以上,很可能細(xì)胞內(nèi)源性啟動子更有利于重組蛋白基因的轉(zhuǎn)錄調(diào)控。
肽延伸因子在細(xì)胞整個周期中都處于高表達,不受細(xì)胞周期影響的看家基因,其基因座序列可能含有一些有利于基因表達的轉(zhuǎn)錄調(diào)控序列,與細(xì)胞的反式作用因子共同作用,促進基因的高表達。runningdeer和allison等(biotechnolprog2004,20(3):880–889)報道了根據(jù)cho細(xì)胞的ef1alpha非編碼區(qū)序列構(gòu)建的表達載體pdef38包含ef1alpha基因的上游4.1kb和4.2kb的下游序列,與商業(yè)化的常用cmv啟動子比較能夠增加外源基因6-35倍的表達量,如果去掉下游的4.2kb的調(diào)控序列導(dǎo)致表達水平降低4倍。但是在這篇文獻中這個表達載體pdef38并沒有測試隨著mtx濃度的增加外源基因也隨之?dāng)U增,我們根據(jù)文獻構(gòu)建的含ef1alpha上下游調(diào)控序列的載體,在實驗中發(fā)現(xiàn)增加mtx濃度外源基因的表達并沒有增加,很可能在它的4kb的調(diào)控序列中含有類似于絕緣子的序列,維持它的表達框類的基因不受周圍環(huán)境影響,從而導(dǎo)致mtx濃度增加只能擴增dhfr基因及其下游序列,而其上游的ef1alpha調(diào)控序列及外源基因不擴增。orlova和kovnir等(bmcbiotechnology2014,14:56)報道了利用ef1alpha基因的上游4.1kb和4.2kb的下游序列在調(diào)控序列之間將目的外源基因通過ires與dhfr基因連接形成一個雙順反子的表達載體,以egfp作為目目的基因時在貼壁培養(yǎng)和懸浮培養(yǎng)時,通過一輪擴增egfp的表達水平分別增加了8倍和4.5倍,說明以這種雙順反子的表達載體即能夠獲得高活性啟動子特性又能夠擴增,但是該文獻沒有驗證其它目的基因的表達情況是否又能夠獲得如此良好的結(jié)果。有文獻(mcgrewjt.vectorsandmethodsforrecombinantproteinexpression,uspatentno:6632637b1.)報道認(rèn)為通過ires連接的兩個基因形成一個大的mrna有可能減少mrna的半衰期;也有可能形成不利于蛋白翻譯的rna二級結(jié)構(gòu);從而導(dǎo)致目的基因的表達降低。因此這種方法的在表達其它蛋白特別是高劑量的抗體類藥物時是否能夠獲得很高的表達水平是否可行不得而知。
技術(shù)實現(xiàn)要素:
為了解決上述問題,本發(fā)明提供了一種提高哺乳動物細(xì)胞中外源基因表達水平的基因片段、重組載體及其用途。
本發(fā)明提高哺乳動物細(xì)胞中外源基因表達水平的基因片段,其特征在于:其核苷酸序列如seqidno.1或2所示。
本發(fā)明重組質(zhì)粒,它是將pcdna3.1(+)質(zhì)粒中啟動子cmv替換為chef-alpha基因5’端的長度為1543bp序列,以及bghpa替換為chef-alpha基因3’端的長度為610bp序列的重組質(zhì)粒。
其中,所述chef-alpha基因5’端的長度為1543bp序列如seqidno.3所示;所述chef-alpha基因3’端的長度為610bp序列如seqidno.4所示。
進一步地,所述重組質(zhì)粒在插入的chef-alpha基因5’端的長度為1543bp序列的5’端還插入有雞溶菌酶的mar基因。
其中,所述mar基因的核苷酸序列如seqidno.5所示。
進一步地,所述重組質(zhì)粒中,neo基因被dhfr基因、gs基因、hygromycin基因、blastcidin基因、puromycin基因或者zeocin基因替代。
其中,所述dhfr基因的核苷酸序列如seqidno.6所示。
本發(fā)明還提供了前述的重組質(zhì)粒在制備表達外源基因的轉(zhuǎn)基因細(xì)胞中的用途;優(yōu)選地,所述外源基因是egfp基因或者aldalimumab基因以及其它外源基因包括細(xì)胞因子及蛋白類激素、蛋白酶類、以及免疫球蛋白融合蛋白、單克隆抗體類等生物技術(shù)藥物。
其中,所述細(xì)胞是哺乳動物細(xì)胞;優(yōu)選地,所述哺乳動物細(xì)胞是cho、bhk、hek293、ns0、perc6細(xì)胞。
本發(fā)明還提供了一種制備表達外源基因的轉(zhuǎn)基因細(xì)胞的方法,步驟如下:
(1)取前述的重組質(zhì)粒,連接外源基因,得攜帶有外源基因重組質(zhì)粒;
(2)取攜帶有外源基因重組質(zhì)粒,轉(zhuǎn)染細(xì)胞,即可。
本發(fā)明采取截短的ef1alpha基因的上下游序列調(diào)控序列,盡可能小的減少其活性的損失,又不影響在mtx加壓擴增時在細(xì)胞中的擴增,在其上游與雞的溶菌酶mar序列組合,能夠克服位置效應(yīng)及增加基因表達穩(wěn)定性;以二氫葉酸還原酶基因(dhfr)為篩選擴增基因,在mtx加壓的情況下能夠?qū)⑼庠椿蚩截悢?shù)擴增,從而進一步提高它的表達量增加表達的穩(wěn)定性。
采用本發(fā)明重組質(zhì)粒攜帶外源基因(如,egfp基因或者aldalimumab基因)轉(zhuǎn)染哺乳細(xì)胞(如,cho細(xì)胞),外源基因的表達水平穩(wěn)定,且外源基因的表達水平高,是改進前質(zhì)粒pcdna3.1的7倍以上,采用本發(fā)明重組質(zhì)粒容易篩選到外源基因高表達的細(xì)胞株,應(yīng)用前景良好。
顯然,根據(jù)本發(fā)明的上述內(nèi)容,按照本領(lǐng)域的普通技術(shù)知識和慣用手段,在不脫離本發(fā)明上述基本技術(shù)思想前提下,還可以做出其它多種形式的修改、替換或變更;以下通過實施例形式的具體實施方式,對本發(fā)明的上述內(nèi)容再作進一步的詳細(xì)說明。但不應(yīng)將此理解為本發(fā)明上述主題的范圍僅限于以下的實例。凡基于本發(fā)明上述內(nèi)容所實現(xiàn)技術(shù)均屬于本發(fā)明的范圍。
附圖說明
圖1cho的肽延伸因子1基因的轉(zhuǎn)錄調(diào)控序列及雞溶菌酶mar序列的克隆
圖2pcdna3.1egfp和含cho肽延伸因子1序列和的載體結(jié)構(gòu)圖
圖3含篩選擴增基因dhfr的不同載體結(jié)構(gòu)圖
圖4含dhfr篩選擴增基因及雞溶菌酶mar序列的載體表達egfp在自然光照射下的圖譜
圖5表達aldalimumab的載體圖及表達蛋白電泳圖譜
具體實施方式
實施例1本發(fā)明重組載體的構(gòu)建及其效果驗證
一、構(gòu)建方法
(一)cho細(xì)胞ef-alpha1的轉(zhuǎn)錄調(diào)控序列及雞溶菌酶mar序列的克隆。
1、cho細(xì)胞基因組dna序列的提取
cho細(xì)胞用d/f培養(yǎng)基10%血清培養(yǎng)至細(xì)胞方瓶長滿,胰酶消化。按transgen公司easypuregenomicdnakit操作說明書提取cho細(xì)胞基因組dna。
2、cho的肽延伸因子1的基因轉(zhuǎn)錄調(diào)控序列的克隆
根據(jù)genbank的報告的序列設(shè)計如下引物:
chef1:5-ataacgcgtgcagatccgtcgagctctcggccaccgagc-3
chef2:5-atagctagcacaccttaaaaaaaaagttcgaagaatacc-3
chef3:5-atatctagaaatattacccctaacacctgccaccccagtc-3
chef4:5-atatccggaagcaaagcctgcctcatatattaatattcac-3
用引物chef1和chef2擴增肽延伸因子1的1543bp的5,端調(diào)控序列,擴增產(chǎn)物含nhei和mlui酶切位點;包括啟動子和內(nèi)含子1的序列,采用transgen公司的
3、雞溶菌酶的mar序列的克隆和報告基因egfp載體的構(gòu)建
從市場上賣雞處取得雞血(加入檸檬酸鈉抗凝),用白細(xì)胞分離液分離出白細(xì)胞。用transgen公司的基因組提取試劑盒(bloodzol)提取基因組dna。根據(jù)genbank報道的雞溶菌酶的mar序列合成以下引物:
chmar1:5-ataggcgcgccgatccgtaatacaattgtaccaggttttgg-3
chmar2:5-atattaattaagaaaacaatatatttccaaatgaaaaaaaaatctg-3
為了便于連接,上游引物的5/端設(shè)計了酶切位點asci,下游引物的5/端設(shè)計了酶切位點paci;采用transgen公司的
(二)包含cho肽延伸因子調(diào)控序列載體的制備
首先對pcdna3.1(+)進行改造,在mlui酶切位點的上游引入酶切位點asci和paci。在改造后的pcdna3.1(+)的ecorv處連入egfp報告基因(egfp報告基因的序列為seqidno.13所示),命名為pcdna3.1egfp,作為對照載體,用chef-alpha基因的5’端1543bp的序列(核苷酸序列如seqidno.3所示,簡稱5’端1.5kb)和3’端610bp的調(diào)控序列(核苷酸序列如seqidno.4所示,簡稱3’端0.6kb)替換pcdna3.1egfp中的cmv啟動子和bghpa,命名為pcdnachef1506egfp,載體結(jié)構(gòu)圖見圖2。
(三)包含雞溶菌酶mar序列及dhfr篩選擴增基因與chef1506的組合
1雞溶菌酶mar序列與pcdnachef1506的組合及表達結(jié)果
將克隆到的雞溶菌酶mar序列用asci和paci酶切,連入經(jīng)同樣酶切的pcdnachef1506egfp中(mar序列是否在chef15的5’端),命名為chmarchef1506egfp,載體結(jié)構(gòu)圖見圖2。
將pcdna3.1egfp、pcdnachef1506egfp、chmarchef1506egfp轉(zhuǎn)染cho-s細(xì)胞后用g418篩選陽性細(xì)胞用流式細(xì)胞儀測定egfp表達強度,結(jié)果見表一。說明1543bp和610bp的chef-alpha調(diào)控序列比cmv啟動子和bghpolya序列提高egfp表達水平7倍;克服位置效應(yīng)的雞溶菌酶mar序列能夠進一步提高載體的表達強度,與未連接雞溶菌酶mar序列的pcdnachef1506egfp載體比較其表達egfp的強度提高了1.7倍,這個組合與最初的pcdna3.1egfp比較提高表達水平超過10倍,可以用作下一步構(gòu)建基因擴增載體用。
表一不同載體表達egfp的熒光強度單位
由表一可以看出,與pcdna3.1(+)載體相比,采用本發(fā)明兩個特定的基因片段(其中,基因片段1為1543bp的chef-alpha基因的5’端序列+610bp的chef-alpha基因3’端調(diào)控序列,基因片段2為雞溶菌酶mar序列+1543bp的chef-alpha基因的5’端序列+610bp的chef-alpha基因3’端調(diào)控序列),替代pcdna3.1(+)載體中的cmv啟動子和bghpa后形成的重組pcdna3.1(+)載體,目標(biāo)基因的表達強度顯著提高。
實驗結(jié)果說明,本發(fā)明兩個特定的基因片段(其中,基因片段1為1543bp的chef-alpha基因的5’端序列+610bp的chef-alpha基因3’端調(diào)控序列【二者之間含多克隆酶切位點】——seqidno.1,基因片段2為雞溶菌酶mar序列+1543bp的chef-alpha基因的5’端序列+610bp的chef-alpha基因3’端調(diào)控序列【三者之間含多克隆酶切位點】——seqidno.2),可以有效提高目標(biāo)基因的表達水平,其中,目標(biāo)基因插入在“1543bp的chef-alpha基因的5’端序列”與“610bp的chef-alpha基因3’端調(diào)控序列”之間。
(四)含篩選擴增基因二氫葉酸還原酶(dhfr)的載體構(gòu)建
用xmai和bstbi酶切dhfr基因和改造后的pcdna3.1(+)載體,用dhfr基因替換改造后的pcdna3.1(+)中的neo基因。所構(gòu)建的載體命名為pcdnadhfr。
用chef-alpha基因的5’端1543bp和3’端610bp調(diào)控序列替換pcdnadhfr中的cmv啟動子和bghpa,命名為chef1506/dhfr。再將雞溶菌酶mar序列連入pcdnachef1506/dhfr中,命名為chmarchef1506/dhfr。
含dhfr的三個載體用nhei、xhoi酶切后與經(jīng)同樣酶切的egfp基因連接構(gòu)建成功的載體分別命名為pcdnadhfregfp、pcdnachef1506egfp/dhfr、chmarchef1506egfp/dhfr(圖3)。將這三個載體分別轉(zhuǎn)染cho-s細(xì)胞后用200nmmtx篩選,兩周后陽性細(xì)胞克隆出現(xiàn)后,增加mtx濃度為1000nm,每4-5天換一次液,兩周后陽性細(xì)胞長滿后用流式細(xì)胞測定egfp表達強度,結(jié)果見表二。
收集chmarchef1506egfp/dhfr陽性細(xì)胞離心后不需要藍光照射在室內(nèi)自然光照射下就能夠見到整個細(xì)胞都是綠色的(圖4),而pcdnadhfregfp、pcdnachef1506egfp/dhfr在自然光照射下沒有明顯看見細(xì)胞顯示出綠色,可見chmarchef1506egfp/dhfr載體能夠高效率的表達外源基因,也能夠通過mtx加壓擴增外源基因的拷貝數(shù)進一步增強外源基因egfp的表達強度。
表二含dhfr的不同載體表達egfp的熒光強度單位
由表二可以看出,與pcdna3.1dhfr載體相比,采用本發(fā)明兩個特定的基因片段(其中,基因片段1為1543bp的chef-alpha基因的5’端序列+610bp的chef-alpha基因3’端調(diào)控序列,基因片段2為雞溶菌酶mar序列+1543bp的chef-alpha基因的5’端序列+610bp的chef-alpha基因3’端調(diào)控序列),替代pcdna3.1(+)載體中的cmv啟動子和bghpa、并用dhfr基因序列替代neo基因后形成的重組pcdnachef1506egfp/dhfr和chmarchef1506egfp/dhfr載體,目標(biāo)基因的表達強度顯著提高。
實施例2用本發(fā)明組合載體chmarchef1506/dhfr表達外源蛋白
通過實施例1表明載體chmarchef1506dhfr表達egfp的熒光強度效果好,表明用cho內(nèi)源性的肽延伸因子1的基因5’和3’端調(diào)控序列和雞溶菌酶mar序列在cho細(xì)胞中表達外源基因效果更好,進一步用外源基因aldalimumab來驗證此載體的效果。
通過nhei和xhoi酶切位點在chmarchef53/dhfr上,aldalimumab重鏈基因(aldalimumab重鏈基因的序列為seqidno.14所示),構(gòu)建成載體chmarchefaldalimumabhc/dhfr(圖5);aldalimumab輕鏈基因(aldalimumab輕鏈基因的序列為seqidno.15所示)同樣通過nhei和xhoi酶切位點連入經(jīng)同樣酶切的載體chmarchef1506/egfp,構(gòu)建成功的載體命名為chmarchefaldalimumablc/neo(圖5)。
構(gòu)建成功的載體用sali線性化后,用脂質(zhì)體lipofectamine2000轉(zhuǎn)染cho-s細(xì)胞,aldalimumab抗體輕重鏈共轉(zhuǎn)染;用0.6mg/mlg418和200nmmtx篩選陽性細(xì)胞,當(dāng)10-14天陽性克隆出現(xiàn),增加mtx濃度至1000nm;2周后陽性細(xì)胞混合克隆活力達到95%左右時對其單克隆化,高表達單克隆進一步加壓至2000nmmtx擴增外源基因,再亞克隆,所獲得高表達細(xì)胞株擴大培養(yǎng),用125ml搖瓶30ml培養(yǎng)體積,用葡萄糖補料,無血清培養(yǎng)基培養(yǎng)至細(xì)胞活力為50%左右收獲培養(yǎng)上清,測定表達量獲得5株表達量較高的細(xì)胞株(見表三)。
表三組合載體表達單克隆抗體aldalimuan結(jié)果
實施例3本發(fā)明組合載體chmarchef1506/dhfr表達外源蛋白的穩(wěn)定性研究
將實施例2搖瓶中獲得高表達的五株細(xì)胞,按3x105/ml細(xì)胞密度接種,3-4天細(xì)胞長至200萬/ml,再按3x105/ml密度接種,在搖瓶中一直以這種方式傳代培養(yǎng)50-60天。結(jié)果表明,所獲得的高表達細(xì)胞株在傳代培養(yǎng)60天左右表達aldalimumab的表達量沒有發(fā)生明顯變化,最終傳代細(xì)胞在用葡萄糖作為補料的無血清培養(yǎng)基中培養(yǎng)14天,這五株細(xì)胞表達量分別1-1.3克/l左右,說明以這種方法構(gòu)建的高表達載體在cho細(xì)胞中表達外源蛋白能夠達到穩(wěn)定高產(chǎn)。
按照文獻資料報道如果在生物反應(yīng)器中優(yōu)化培養(yǎng)條件,結(jié)合控制融氧和ph以及溫度的變化,補料改用氨基酸、維生素礦物質(zhì)和糖類,能夠進一步提高細(xì)胞密度,延長培養(yǎng)時間,抗體類蛋白藥物能夠提高表達進一步提高,具體表達量可以達到2-3克/l。
綜上,本發(fā)明重組質(zhì)粒攜帶外源基因(如,egfp基因或者aldalimumab基因)轉(zhuǎn)染哺乳細(xì)胞(如,cho細(xì)胞),外源基因的表達水平穩(wěn)定,且外源基因的表達水平高,是改進前質(zhì)粒pcdna3.1的7倍以上,采用本發(fā)明重組質(zhì)粒容易篩選到外源基因高表達的細(xì)胞株,應(yīng)用前景良好。
sequencelisting
<110>四川豐訊科技發(fā)展有限公司
<120>一種提高哺乳動物細(xì)胞中外源基因表達水平的基因片段、重組載體及其用途
<130>gy456-17p1062
<160>15
<170>patentinversion3.5
<210>1
<211>2189
<212>dna
<213>有效提高目標(biāo)基因表達水平的基因片段1
<400>1
acgcgtgcagatccgtcgagctctcggccaccgagctgagcccttaggttctggggctgg60
gaagggtccctaggattgtgcacctctcccgcgggggacaagcaggggatggcggggctg120
acgtcgggaggtggcctccacgggaagggacacccggatctcgacacagccttggcagtg180
gagtcaggaagggtaggacagattctggacgccctcttggccagtcctcaccgccccacc240
cccgatggagccgagagtaattcatacaaaaggagggatcgccttcgcccctgggaatcc300
cagggaccgtcgctaaattctggccggcctcccagcccggaaccgctgtgcccgcccagc360
gcggcgggaggagcctgcgcctagggcggatcgcgggtcggcgggagagcacaagcccac420
agtccccggcggtgggggaggggcgcgctgagcgggggcccgggagccagcgcggggcaa480
actgggaaagtggtgtcgtgtgctggctccgccctcttcccgagggtgggggagaacggt540
ataaaagtgcggtagtcgcgttggacgttctttttcgcaacgggtttgccgtcagaacgc600
aggtgagtggcgggtgtggcctccgcgggcccgggctccctcctttgagcggggtcggac660
cgccgtgcgggtgtcgtcggccgggcttctctgcgagcgttcccgccctggatggcgggc720
tgtgcgggagggcgagggggggaggcctggcggcggccccggagcctcgcctcgtgtcgg780
gcgtgaggcctagcgtggcttccgccccgccgcgtgccaccgcggccgcgctttgctgtc840
tgcccggctgccctcgattgcctgcccgcggcccgggccaacaaagggagggcgtggagc900
tggctggtagggagccccgtagtccgcatgtcgggcagggagagcggcagcagtcggggg960
ggggaccgggcccgcccgtcccgcagcacatgtccgacgccgcctggacgggtagcggcc1020
tgtgtcctgataaggcggccgggcggtgggttttagatgccgggttcaggtggccccggg1080
tcccggcccggtctggccagtaccccgtagtggcttagctccgaggagggcgagcccgcc1140
cgcccggcaccagttgcgtgcgcggaaagatggccgctcccgggccctgtagcaaggagc1200
tcaaaatggaggacgcggcagcccggcggagcggggcgggtgagtcacccacacaaagga1260
agagggccttgcccctcgccggccgctgcttcctgtgaccccgtggtgtaccggccgcac1320
ttcagtcaccccgggcgctctttcggagcaccgctggcctccgctgggggaggggatctg1380
tctaatggcgttggagtttgctcacatttggtgggtggagactgtagccaggccagcctg1440
gccatggaagtaattcttggaatttgcccattttgagtttggagcgaagctgattgacaa1500
agctgcttagccgttcaaaggtattcttcgaactttttttttaaggtgtgctagcgatat1560
cctcgagtctagaaatattacccctaacacctgccaccccagtcttaatcagtggtggaa1620
gaacggtctcagaactgtttgtctcaattggccatttaagtttaatagtgaaagactggt1680
taatgataacaatgcatcggaaaaccttcaggaggaaaggagaatgttttgtggaacatt1740
tttgtgtgtgtggcagttttaagttattagttttcaaaatcagtactttttaatggaaac1800
aacttgaccaaaaatctgtcacagaattttgagacccattaaaatacaagtttaatgaga1860
agtctgtctctgttaatgctgaagtcattactaagtgcttagcttagcaaggtatgtgga1920
tgcccatttgtgttccaagggattggactgttcatcaggacccagagctgagtttcaagg1980
gctcaagagatggcttattacctgtgggtgtcttgaaggttctggttgggacaaattagg2040
aatgtttttggcagacatggtgactaccttcatctgggtgagttcagttgatttgtcttg2100
agcctttggggtttacacaagtaaatgacatcatacagttagtgtattgttagtgaatat2160
taatatatgaggcaggctttgcttccgga2189
<210>2
<211>5171
<212>dna
<213>有效提高目標(biāo)基因的表達水平2
<400>2
ggcgcgccgatccgtaatacaattgtaccaggttttggtttattacatgtgactgacggc60
ttcctgtgcgtgctcaggaaacggcagttgggcactgcactgcccggtgatggtgccacg120
gtggctcctgccgccttctttgatattcactctgttgtatttcatctcttcttgccgatg180
aaaggatataacagtctgtgaggaaatacttggtatttcttctgatcagcgtttttataa240
gtaatgttgaatattggataaggctgtgtgtcctttgtcttgggagacaaagcccacagc300
aggtggtggttggggtggtggcagctcagtgacaggagaggtttttttgcctgttttttt360
tgttgttttttttttttaagtaaggtgttcttttttcttagtaaaatttctactggactg420
tatgttttgacaggtcagaaacatttcttcaaaagaagaaccttttggaaactgtacagc480
ccttttctttcattccctttttgctttctgtgccaatgcctttggttctgatttgcatta540
tggaaaacgttgatcggaacttgaggtttttatttatagtgtggcttgaaagcttggata600
gctgttgttacatgagataccttattaagtttaggccagcttgatgctttatttttttcc660
ctttgaagtagtgagcgttctctggtttttttcctttgaaactggcgaggcttagatttt720
tctaatgggattttttacctgatgatctagttgcatacccaaatgcttgtaaatgttttc780
ctagttaacatgttgataacttcggatttacatgttgtatatacttgtcatctgtgtttc840
tagtaaaaatatatggcatttatagaaatacgtaattcctgatttccttttttttttatc900
tctatgctctgtgtgtacaggtcaaacagacttcactcctatttttatttatagaatttt960
atatgcagtctgtcgttggttcttgtgttgtaaggatacagccttaaatttcctagagcg1020
atgctcagtaaggcgggttgtcacatgggttcaaatgtaaaacgggcacgtttggctgct1080
gccttcccgagatccaggacactaaactgcttctgcactgaggtataaatcgcttcagat1140
cccagggaagtgtagatccacgtgcatattcttaaagaagaatgaatactttctaaaata1200
ttttggcataggaagcaagctgcatggatttgtttgggacttaaattattttggtaacgg1260
agtgcataggttttaaacacagttgcagcatgctaacgagtcacagcatttatgcagaag1320
tgatgcctgttgcagctgtttacggcactgccttgcagtgagcgatttgcagataggggt1380
ggggtgctttgtgtcgtgttcccacacgctgccacacagccacctcccggaacacatctc1440
acctgctgggtacttttcaaaccatcttagcagtagtagatgagttactatgaaacagag1500
aagttcctcagttggatattctcatgggatgtcttttttcccatgttgggcaaagtatga1560
taaagcatctctatttgtaaattatgcacttgttagttcctgaatcctttctatagcacc1620
acttattgcagcaggtgtaggctctggtgtggcctgtgtctgtgcttcaatcttttaagc1680
ttctttggaaatacactgacttgattgaagtctcttgaagatagtaaacagtacttacct1740
ttgatcccaatgaaatcgagcatttcagttgtaaaagaattccgcctattcataccatgt1800
aatgtaattttacacccccagtgctgacactttggaatatattcaagtaatagactttgg1860
cctcaccctcttgtgtactgtattttgtaatagaaaatattttaaactgtgcatatgatt1920
attacattatgaaagagacattctgctgatcttcaaatgtaagaaaatgaggagtgcgtg1980
tgcttttataaatacaagtgattgcaaattagtgcaggtgtccttaaaaaaaaaaaaaag2040
taatataaaaaggaccaggtgttttacaagtgaaatacattcctatttggtaaacagtta2100
catttttatgaagattaccagcgctgctgactttctaaacataaggctgtattgtcttcc2160
tgtaccattgcatttcctcattcccaatttgcacaaggatgtctgggtaaactattcaag2220
aaatggctttgaaatacagcatgggagcttgtctgagttggaatgcagagttgcactgca2280
aaatgtcaggaaatggatgtctctcagaatgcccaactccaaaggattttatatgtgtat2340
atagtaagcagtttcctgattccagcaggccaaagagtctgctgaatgttgcgttgccgg2400
agacctgtatttctcaacaaggtaagatggtatcctagcaactgcggattttaatacatt2460
ttcagcagaagtacttagttaatctctacctttagggatcgtttcatcatttttagatgt2520
tatacttgaaatactgcataacttttagctttcatgggttcctttttttcagcctttagg2580
agactgttaagcaatttgctgtccaacttttgtgttggtcttaaactgcaatagtagttt2640
accttgtattgaagaaataaagaccatttttatattaaaaaatacttttgtctgtcttca2700
ttttgacttgtctgatatccttgcagtgctcattatgtcagttctgtcagatattcagac2760
atcaaaacttaacgtgagctcagtggagttacagctgcggttttgatgctgttattattt2820
ctgaaactagaaatgatgttgtcttcatctgctcatcaaacacttcatgcagagtttaag2880
gctagtgagaaatgcatacatttattgatacttttttaaagtcaactttttatcagattt2940
ttttttcatttggaaatatattgttttcggatccttaattaaacgcgtgcagatccgtcg3000
agctctcggccaccgagctgagcccttaggttctggggctgggaagggtccctaggattg3060
tgcacctctcccgcgggggacaagcaggggatggcggggctgacgtcgggaggtggcctc3120
cacgggaagggacacccggatctcgacacagccttggcagtggagtcaggaagggtagga3180
cagattctggacgccctcttggccagtcctcaccgccccacccccgatggagccgagagt3240
aattcatacaaaaggagggatcgccttcgcccctgggaatcccagggaccgtcgctaaat3300
tctggccggcctcccagcccggaaccgctgtgcccgcccagcgcggcgggaggagcctgc3360
gcctagggcggatcgcgggtcggcgggagagcacaagcccacagtccccggcggtggggg3420
aggggcgcgctgagcgggggcccgggagccagcgcggggcaaactgggaaagtggtgtcg3480
tgtgctggctccgccctcttcccgagggtgggggagaacggtataaaagtgcggtagtcg3540
cgttggacgttctttttcgcaacgggtttgccgtcagaacgcaggtgagtggcgggtgtg3600
gcctccgcgggcccgggctccctcctttgagcggggtcggaccgccgtgcgggtgtcgtc3660
ggccgggcttctctgcgagcgttcccgccctggatggcgggctgtgcgggagggcgaggg3720
ggggaggcctggcggcggccccggagcctcgcctcgtgtcgggcgtgaggcctagcgtgg3780
cttccgccccgccgcgtgccaccgcggccgcgctttgctgtctgcccggctgccctcgat3840
tgcctgcccgcggcccgggccaacaaagggagggcgtggagctggctggtagggagcccc3900
gtagtccgcatgtcgggcagggagagcggcagcagtcgggggggggaccgggcccgcccg3960
tcccgcagcacatgtccgacgccgcctggacgggtagcggcctgtgtcctgataaggcgg4020
ccgggcggtgggttttagatgccgggttcaggtggccccgggtcccggcccggtctggcc4080
agtaccccgtagtggcttagctccgaggagggcgagcccgcccgcccggcaccagttgcg4140
tgcgcggaaagatggccgctcccgggccctgtagcaaggagctcaaaatggaggacgcgg4200
cagcccggcggagcggggcgggtgagtcacccacacaaaggaagagggccttgcccctcg4260
ccggccgctgcttcctgtgaccccgtggtgtaccggccgcacttcagtcaccccgggcgc4320
tctttcggagcaccgctggcctccgctgggggaggggatctgtctaatggcgttggagtt4380
tgctcacatttggtgggtggagactgtagccaggccagcctggccatggaagtaattctt4440
ggaatttgcccattttgagtttggagcgaagctgattgacaaagctgcttagccgttcaa4500
aggtattcttcgaactttttttttaaggtgtgctagcgatatcctcgagtctagaaatat4560
tacccctaacacctgccaccccagtcttaatcagtggtggaagaacggtctcagaactgt4620
ttgtctcaattggccatttaagtttaatagtgaaagactggttaatgataacaatgcatc4680
ggaaaaccttcaggaggaaaggagaatgttttgtggaacatttttgtgtgtgtggcagtt4740
ttaagttattagttttcaaaatcagtactttttaatggaaacaacttgaccaaaaatctg4800
tcacagaattttgagacccattaaaatacaagtttaatgagaagtctgtctctgttaatg4860
ctgaagtcattactaagtgcttagcttagcaaggtatgtggatgcccatttgtgttccaa4920
gggattggactgttcatcaggacccagagctgagtttcaagggctcaagagatggcttat4980
tacctgtgggtgtcttgaaggttctggttgggacaaattaggaatgtttttggcagacat5040
ggtgactaccttcatctgggtgagttcagttgatttgtcttgagcctttggggtttacac5100
aagtaaatgacatcatacagttagtgtattgttagtgaatattaatatatgaggcaggct5160
ttgcttccgga5171
<210>3
<211>1543
<212>dna
<213>chef-alpha基因的5'端1543bp的序列
<400>3
gcagatccgtcgagctctcggccaccgagctgagcccttaggttctggggctgggaaggg60
tccctaggattgtgcacctctcccgcgggggacaagcaggggatggcggggctgacgtcg120
ggaggtggcctccacgggaagggacacccggatctcgacacagccttggcagtggagtca180
ggaagggtaggacagattctggacgccctcttggccagtcctcaccgccccacccccgat240
ggagccgagagtaattcatacaaaaggagggatcgccttcgcccctgggaatcccaggga300
ccgtcgctaaattctggccggcctcccagcccggaaccgctgtgcccgcccagcgcggcg360
ggaggagcctgcgcctagggcggatcgcgggtcggcgggagagcacaagcccacagtccc420
cggcggtgggggaggggcgcgctgagcgggggcccgggagccagcgcggggcaaactggg480
aaagtggtgtcgtgtgctggctccgccctcttcccgagggtgggggagaacggtataaaa540
gtgcggtagtcgcgttggacgttctttttcgcaacgggtttgccgtcagaacgcaggtga600
gtggcgggtgtggcctccgcgggcccgggctccctcctttgagcggggtcggaccgccgt660
gcgggtgtcgtcggccgggcttctctgcgagcgttcccgccctggatggcgggctgtgcg720
ggagggcgagggggggaggcctggcggcggccccggagcctcgcctcgtgtcgggcgtga780
ggcctagcgtggcttccgccccgccgcgtgccaccgcggccgcgctttgctgtctgcccg840
gctgccctcgattgcctgcccgcggcccgggccaacaaagggagggcgtggagctggctg900
gtagggagccccgtagtccgcatgtcgggcagggagagcggcagcagtcgggggggggac960
cgggcccgcccgtcccgcagcacatgtccgacgccgcctggacgggtagcggcctgtgtc1020
ctgataaggcggccgggcggtgggttttagatgccgggttcaggtggccccgggtcccgg1080
cccggtctggccagtaccccgtagtggcttagctccgaggagggcgagcccgcccgcccg1140
gcaccagttgcgtgcgcggaaagatggccgctcccgggccctgtagcaaggagctcaaaa1200
tggaggacgcggcagcccggcggagcggggcgggtgagtcacccacacaaaggaagaggg1260
ccttgcccctcgccggccgctgcttcctgtgaccccgtggtgtaccggccgcacttcagt1320
caccccgggcgctctttcggagcaccgctggcctccgctgggggaggggatctgtctaat1380
ggcgttggagtttgctcacatttggtgggtggagactgtagccaggccagcctggccatg1440
gaagtaattcttggaatttgcccattttgagtttggagcgaagctgattgacaaagctgc1500
ttagccgttcaaaggtattcttcgaactttttttttaaggtgt1543
<210>4
<211>610
<212>dna
<213>chef-alpha基因的3'端610bp的調(diào)控序列
<400>4
aatattacccctaacacctgccaccccagtcttaatcagtggtggaagaacggtctcaga60
actgtttgtctcaattggccatttaagtttaatagtgaaagactggttaatgataacaat120
gcatcggaaaaccttcaggaggaaaggagaatgttttgtggaacatttttgtgtgtgtgg180
cagttttaagttattagttttcaaaatcagtactttttaatggaaacaacttgaccaaaa240
atctgtcacagaattttgagacccattaaaatacaagtttaatgagaagtctgtctctgt300
taatgctgaagtcattactaagtgcttagcttagcaaggtatgtggatgcccatttgtgt360
tccaagggattggactgttcatcaggacccagagctgagtttcaagggctcaagagatgg420
cttattacctgtgggtgtcttgaaggttctggttgggacaaattaggaatgtttttggca480
gacatggtgactaccttcatctgggtgagttcagttgatttgtcttgagcctttggggtt540
tacacaagtaaatgacatcatacagttagtgtattgttagtgaatattaatatatgaggc600
aggctttgct610
<210>5
<211>2960
<212>dna
<213>mar基因的核苷酸序列
<400>5
gatccgtaatacaattgtaccaggttttggtttattacatgtgactgacggcttcctgtg60
cgtgctcaggaaacggcagttgggcactgcactgcccggtgatggtgccacggtggctcc120
tgccgccttctttgatattcactctgttgtatttcatctcttcttgccgatgaaaggata180
taacagtctgtgaggaaatacttggtatttcttctgatcagcgtttttataagtaatgtt240
gaatattggataaggctgtgtgtcctttgtcttgggagacaaagcccacagcaggtggtg300
gttggggtggtggcagctcagtgacaggagaggtttttttgcctgttttttttgttgttt360
tttttttttaagtaaggtgttcttttttcttagtaaaatttctactggactgtatgtttt420
gacaggtcagaaacatttcttcaaaagaagaaccttttggaaactgtacagcccttttct480
ttcattccctttttgctttctgtgccaatgcctttggttctgatttgcattatggaaaac540
gttgatcggaacttgaggtttttatttatagtgtggcttgaaagcttggatagctgttgt600
tacatgagataccttattaagtttaggccagcttgatgctttatttttttccctttgaag660
tagtgagcgttctctggtttttttcctttgaaactggcgaggcttagatttttctaatgg720
gattttttacctgatgatctagttgcatacccaaatgcttgtaaatgttttcctagttaa780
catgttgataacttcggatttacatgttgtatatacttgtcatctgtgtttctagtaaaa840
atatatggcatttatagaaatacgtaattcctgatttccttttttttttatctctatgct900
ctgtgtgtacaggtcaaacagacttcactcctatttttatttatagaattttatatgcag960
tctgtcgttggttcttgtgttgtaaggatacagccttaaatttcctagagcgatgctcag1020
taaggcgggttgtcacatgggttcaaatgtaaaacgggcacgtttggctgctgccttccc1080
gagatccaggacactaaactgcttctgcactgaggtataaatcgcttcagatcccaggga1140
agtgtagatccacgtgcatattcttaaagaagaatgaatactttctaaaatattttggca1200
taggaagcaagctgcatggatttgtttgggacttaaattattttggtaacggagtgcata1260
ggttttaaacacagttgcagcatgctaacgagtcacagcatttatgcagaagtgatgcct1320
gttgcagctgtttacggcactgccttgcagtgagcgatttgcagataggggtggggtgct1380
ttgtgtcgtgttcccacacgctgccacacagccacctcccggaacacatctcacctgctg1440
ggtacttttcaaaccatcttagcagtagtagatgagttactatgaaacagagaagttcct1500
cagttggatattctcatgggatgtcttttttcccatgttgggcaaagtatgataaagcat1560
ctctatttgtaaattatgcacttgttagttcctgaatcctttctatagcaccacttattg1620
cagcaggtgtaggctctggtgtggcctgtgtctgtgcttcaatcttttaagcttctttgg1680
aaatacactgacttgattgaagtctcttgaagatagtaaacagtacttacctttgatccc1740
aatgaaatcgagcatttcagttgtaaaagaattccgcctattcataccatgtaatgtaat1800
tttacacccccagtgctgacactttggaatatattcaagtaatagactttggcctcaccc1860
tcttgtgtactgtattttgtaatagaaaatattttaaactgtgcatatgattattacatt1920
atgaaagagacattctgctgatcttcaaatgtaagaaaatgaggagtgcgtgtgctttta1980
taaatacaagtgattgcaaattagtgcaggtgtccttaaaaaaaaaaaaaagtaatataa2040
aaaggaccaggtgttttacaagtgaaatacattcctatttggtaaacagttacattttta2100
tgaagattaccagcgctgctgactttctaaacataaggctgtattgtcttcctgtaccat2160
tgcatttcctcattcccaatttgcacaaggatgtctgggtaaactattcaagaaatggct2220
ttgaaatacagcatgggagcttgtctgagttggaatgcagagttgcactgcaaaatgtca2280
ggaaatggatgtctctcagaatgcccaactccaaaggattttatatgtgtatatagtaag2340
cagtttcctgattccagcaggccaaagagtctgctgaatgttgcgttgccggagacctgt2400
atttctcaacaaggtaagatggtatcctagcaactgcggattttaatacattttcagcag2460
aagtacttagttaatctctacctttagggatcgtttcatcatttttagatgttatacttg2520
aaatactgcataacttttagctttcatgggttcctttttttcagcctttaggagactgtt2580
aagcaatttgctgtccaacttttgtgttggtcttaaactgcaatagtagtttaccttgta2640
ttgaagaaataaagaccatttttatattaaaaaatacttttgtctgtcttcattttgact2700
tgtctgatatccttgcagtgctcattatgtcagttctgtcagatattcagacatcaaaac2760
ttaacgtgagctcagtggagttacagctgcggttttgatgctgttattatttctgaaact2820
agaaatgatgttgtcttcatctgctcatcaaacacttcatgcagagtttaaggctagtga2880
gaaatgcatacatttattgatacttttttaaagtcaactttttatcagatttttttttca2940
tttggaaatatattgttttc2960
<210>6
<211>564
<212>dna
<213>dhfr基因的核苷酸序列
<400>6
atggttcgaccattgaactgcatcgtcgccgtgtcccaaaatatggggattggcaagaac60
ggagacctaccctggcctccgctcaggaacgagttcaagtacttccaaagaatgaccaca120
acctcttcagtggaaggtaaacagaatctggtgattatgggtaggaaaacctggttctcc180
attcctgagaagaatcgacctttaaaggacagaattaatatagttctcagtagagaactc240
aaagaaccaccacgaggagctcattttcttgccaaaagtttggatgatgccttaagactt300
attgaacaaccggaattggcaagtaaagtagacatggtttggatagtcggaggcagttct360
gtttaccaggaagccatgaatcaaccaggccacctcagactctttgtgacaaggatcatg420
caggaatttgaaagtgacacgtttttcccagaaattgatttggggaaatataaacttctc480
ccagaatacccaggcgtcctctctgaggtccaggaggaaaaaggcatcaagtataagttt540
gaagtctacgagaagaaagactaa564
<210>7
<211>39
<212>dna
<213>chef1
<400>7
ataacgcgtgcagatccgtcgagctctcggccaccgagc39
<210>8
<211>39
<212>dna
<213>chef2
<400>8
atagctagcacaccttaaaaaaaaagttcgaagaatacc39
<210>9
<211>40
<212>dna
<213>chef3
<400>9
atatctagaaatattacccctaacacctgccaccccagtc40
<210>10
<211>40
<212>dna
<213>chef4
<400>10
atatccggaagcaaagcctgcctcatatattaatattcac40
<210>11
<211>41
<212>dna
<213>chmar1
<400>11
ataggcgcgccgatccgtaatacaattgtaccaggttttgg41
<210>12
<211>46
<212>dna
<213>chmar2
<400>12
atattaattaagaaaacaatatatttccaaatgaaaaaaaaatctg46
<210>13
<211>720
<212>dna
<213>egfp報告基因
<400>13
atggtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggac60
ggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctac120
ggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccacc180
ctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaag240
cagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttc300
ttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctg360
gtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcac420
aagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaac480
ggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgcc540
gaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccac600
tacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtc660
ctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaagtaa720
<210>14
<211>1404
<212>dna
<213>aldalimumab重鏈基因的序列(含信號肽序列)
<400>14
atgcctctcctcctgctgctgcctctgctgtgggctggcgctctggctgaagtgcagctg60
gtggaatctggcggcggactggtgcagcctggcagaagcctgagactgagctgtgccgcc120
agcggcttcaccttcgacgactacgctatgcactgggtgcgacaggcccctggcaaggga180
ctggaatgggtgtccgccatcacctggaacagcggccacatcgactacgccgacagcgtg240
gaaggcagattcaccatcagcagagacaacgccaagaacagcctgtacctgcagatgaac300
tccctgagagccgaggacaccgccgtgtactactgcgccaaggtgtcctacctgagcacc360
gccagcagcctggattactggggccagggaacactcgtgaccgtgtctagcgccagcacc420
aagggccctagcgtgttccctctggcccctagcagcaagtctaccagcggcggaacagcc480
gctctgggctgcctcgtgaaggactacttccccgagcccgtgacagtgtcctggaactct540
ggcgccctgacaagcggcgtgcacacattccctgccgtgctgcagtctagcggcctgtac600
agcctgagcagcgtcgtgactgtgcccagcagctctctgggcacccagacctacatctgc660
aacgtgaaccacaagcccagcaacaccaaggtggacaagaaggtggaacccaagagctgc720
gacaagacccacacctgtcctccctgtcctgcccccgaactgctgggaggcccttccgtg780
ttcctgttccccccaaagcccaaggacaccctgatgatcagcagaacccccgaagtgacc840
tgcgtggtggtggacgtgtcccacgaggaccctgaagtgaagttcaattggtacgtggac900
ggcgtggaagtgcacaacgctaagaccaagcctagagaggaacagtacaacagcacctac960
agagtggtgtccgtgctgacagtgctgcatcaggactggctgaacggcaaagagtacaag1020
tgcaaagtgtccaacaaggccctgccagcccccatcgaaaagaccatctccaaggccaag1080
ggccagcccagggaaccccaggtgtacacactgcctccaagcagggacgagctgaccaag1140
aaccaggtgtccctgacctgtctcgtgaaaggcttctacccctccgatatcgccgtggaa1200
tgggagagcaacggccagcccgagaacaactacaagaccaccccccctgtgctggacagc1260
gacggctcattcttcctgtactccaagctgaccgtggacaagtccagatggcagcagggc1320
aacgtgttcagctgcagcgtgatgcacgaggccctgcacaaccactacacccagaagtcc1380
ctgagcctgagccccggcaaatga1404
<210>15
<211>693
<212>dna
<213>aldalimumab輕鏈基因(含信號肽序列)
<400>15
atgcctctcctcctgctgctgcctctgctgtgggctggcgccctggccgacattcagatg60
acacagagccccagcagcctgagcgccagcgtgggagacagagtgaccatcacctgtaga120
gccagccagggcatcagaaactacctggcctggtatcagcagaagcccggcaaggccccc180
aagctgctgatctacgccgccagcacactgcagtctggcgtgccctctagattcagcggc240
agcggctctggcaccgacttcaccctgaccatcagctccctgcagccagaggacgtggcc300
acctactactgccagagatacaacagggccccctacacctttggccagggcaccaaggtg360
gaaatcaagagaaccgtggccgctcccagcgtgttcatcttcccacctagcgacgagcag420
ctgaagtccggcacagcctctgtcgtgtgcctgctgaacaacttctacccccgcgaggcc480
aaggtgcagtggaaggtggacaacgccctgcagagcggcaacagccaggaaagcgtgacc540
gagcaggacagcaaggactccacctacagcctgtccagcaccctgacactgagcaaggcc600
gactacgagaagcacaaggtgtacgcctgcgaagtgacccaccagggcctgagcagccct660
gtgaccaagagcttcaacagaggcgagtgctga693