衍生自人基因的啟動子的制作方法
【專利摘要】本發(fā)明涉及轉(zhuǎn)染的哺乳動物宿主細胞(其分泌外源蛋白的能力已通過使用具有衍生自人基因的啟動子的外源基因表達載體得到增強),以及利用所述細胞生產(chǎn)外源蛋白的方法。提供了用于增強充當?shù)鞍姿幬锏耐庠吹鞍自谂囵B(yǎng)的哺乳動物細胞或其它宿主細胞中的生產(chǎn)的方法。提供了衍生自人基因的啟動子,所述人基因在培養(yǎng)的哺乳動物細胞或其它宿主中具有比巨細胞病毒(CMV)啟動子更強的啟動子活性。
【專利說明】衍生自人基因的啟動子
【技術領域】
[0001] 本發(fā)明涉及轉(zhuǎn)染的哺乳動物宿主細胞(其外源蛋白轉(zhuǎn)錄活性已通過使用具有衍生 自人基因的啟動子的外源基因表達載體得到增強),以及利用所述宿主細胞生產(chǎn)外源蛋白 的方法。
【背景技術】
[0002] 由于遺傳重組技術的發(fā)展,蛋白藥物產(chǎn)品,例如治療性蛋白和抗體藥物的市場已 快速擴增。尤其是,抗體藥物當施用到人體時可以具有高特異性,而不導致不良免疫反應, 并且因此其開發(fā)已被積極推進。
[0003] 作為通過其產(chǎn)生以抗體藥物為代表的藥物蛋白產(chǎn)品的宿主,可以使用微生物、酵 母、昆蟲、動物或植物細胞、轉(zhuǎn)基因動物或植物細胞等。為了使藥物蛋白產(chǎn)品具有生物學活 性或免疫原性,翻譯后修飾例如折疊或糖基化是必需的。因此,微生物(使用其無法進行復 雜的翻譯后修飾),或植物(具有不同聚糖結(jié)構(gòu)),不適合作為宿主??紤]到這種細胞具有聚 糖結(jié)構(gòu)類似于人的聚糖結(jié)構(gòu)并且安全,并且使用這種細胞可以進行翻譯后修飾,使用培養(yǎng) 的哺乳動物細胞例如CH0 (中國倉鼠卵巢)細胞,其來自于與人密切相關的物種,是目前的 標準。
[0004] 在培養(yǎng)的哺乳動物細胞用作宿主的情況下,問題在于相比使用微生物或類似物生 長速率較低,生產(chǎn)效率低,成本高等(NPL 1)。另外,為了臨床使用藥物蛋白產(chǎn)品,必須施用 大量的產(chǎn)品。因此,其生產(chǎn)能力的缺乏是另一個世界性的問題。當在培養(yǎng)的哺乳動物細胞表 達系統(tǒng)中生產(chǎn)藥物蛋白產(chǎn)品時,相比低分子量合成藥物產(chǎn)品生產(chǎn)成本較高。已經(jīng)進行相應 的嘗試以通過改善相應生產(chǎn)步驟來減少生產(chǎn)成本。在培養(yǎng)的哺乳動物細胞表達系統(tǒng)中生產(chǎn) 量的改善是減少生產(chǎn)成本的有效方法(NPL 2和NPL 3)。因此,為了改善外源基因在培養(yǎng)的 哺乳動物細胞中的生產(chǎn)效率,已經(jīng)研究了基于啟動子、增強子、抗生素選擇標志物、基因擴 增、培養(yǎng)工程改造技術等的各種方法。當其中CH0細胞用作宿主細胞表達外源基因(S卩,生 產(chǎn)藥物蛋白產(chǎn)品)的情況下,通常使用病毒衍生的、人巨細胞病毒主要立即早期啟動子(下 文稱作"CMV啟動子")(NPL4、NPL 5和NPL 6)。另外,已知可以使用人核糖體蛋白基因例如 RPL32或RPS11的轉(zhuǎn)錄起始位點上游多核苷酸作為DNA元件,用于在CH0細胞中的蛋白表 達,組合另一種異源啟動子(NPL7和PLT 1)。
[0005] 引用列表 專利文獻 PTL :; MO 2 00 6/12 309.7 非專利文獻 NPL 1: Flarian M. Wurm, , ?-lat? Biotechool a 22(11): 1393-1398, 2004 I^IPL 2 : Farid SS.# J Chromatogr B Analyt Technol Biomed Life Sci. S4S⑴:8-18r 2007 K?L 3: Werner RG. Economic aspects of coTOercial manufacture of faiopharmaceuticaIs * J Biotechnoi. 113 {1-3): 171-腿# 2004 NPL 4: Durocher Y et al.r Curr Opin Biotechnoi - 20(6): 700-707, 2009 Wh 5: Eoshart M et al e r Cell* 41(2) : 521?530# 1985 NPL 6: Foecking MK et al ·, Gene. 45(1) : 101-105, 1 986 NPL 7: Hoeksema et al, r Biotechnology Research Internationalr Volume 2011# Article ID 4928?5# 11 pages。
[0006] 發(fā)明概述 技術問題 本發(fā)明的一個目標是提供用于增加要用在藥物蛋白產(chǎn)品中的外源蛋白生產(chǎn)的方法,所 述方法使用對增強宿主細胞例如培養(yǎng)的哺乳動物細胞中外源基因的表達具有高活性的啟 動子。通過鑒定在CH0細胞等中具有等于或高于CMV啟動子的啟動子活性的啟動子,提供了 在哺乳動物細胞中穩(wěn)定地實現(xiàn)高的外源基因表達的方法,并且可以提供有利于改善生產(chǎn)水 平(換句話說,減少藥物蛋白產(chǎn)品在培養(yǎng)的哺乳動物細胞表達系統(tǒng)中的生產(chǎn)成本)的方法。
[0007] 問題解決方案 本發(fā)明人為了解決上述問題進行了深入研究,并發(fā)現(xiàn)從位于轉(zhuǎn)錄起始位點上游約2kbp 的核苷酸開始,并在緊接對應于人核糖體蛋白基因起始密碼子的核苷酸序列上游的核苷酸 終止的多核苷酸具有高的啟動子活性。他們發(fā)現(xiàn)所述啟動子活性可以顯著改善在培養(yǎng)的哺 乳動物細胞中表達的外源蛋白的生產(chǎn),并且從而完成本發(fā)明。本發(fā)明包括下列方面。
[0008] (1)包含由序列表中SEQ ID NO: 1所不的核苷酸序列的多核苷酸。
[0009] (2)包含由序列表中SEQ ID N0: 2所不的核苷酸序列的多核苷酸。
[0010] (3)包含由序列表中SEQ ID N0: 3所不的核苷酸序列的多核苷酸。
[0011] (4)包含與根據(jù)上述(1)至(3)任一項的多核苷酸的核苷酸序列具有95%或更高 同一'I"生的核苷酸序列并具有啟動子活性的多核苷酸。
[0012] (5)包含與根據(jù)上述(1)至(3)任一項的多核苷酸的核苷酸序列具有99%或更高 同一'I"生的核苷酸序列并具有啟動子活性的多核苷酸。
[0013] (6)在嚴格條件下與包含與根據(jù)上述(1)至(3)任一項的多核苷酸的核苷酸序列 互補的核苷酸序列的多核苷酸雜交并具有啟動子活性的多核苷酸。
[0014] (7)包含根據(jù)上述(1)至(6)任一項的多核苷酸的外源基因表達單元。
[0015] (8)根據(jù)上述(7)的外源基因表達單元,其中所述外源基因是編碼多聚體蛋白的基 因。
[0016] (9)根據(jù)上述(7)的外源基因表達單元,其中所述外源基因是編碼異源多聚體蛋白 的基因。
[0017] (10)根據(jù)上述(7)的外源基因表達單元,其中所述外源基因是編碼抗體或其功能 片段的基因。
[0018] (11)包含根據(jù)上述(7 )至(10 )任一項的外源基因表達單元的外源基因表達載體。
[0019] (12)包含根據(jù)上述(7)至(10)任一項的外源基因表達單元和一種或多種選自下 列組A中(a)至(i)所述的多核苷酸的外源基因表達載體: 組A (a) 包含由序列表中SEQ ID NO: 10所示的核苷酸序列的多核苷酸; (b) 包含由序列表中SEQ ID N0: 11所示的核苷酸序列的多核苷酸; (c) 包含由序列表中SEQ ID N0: 12所示的核苷酸序列的多核苷酸; (d) 包含由序列表中SEQ ID N0: 13所示的核苷酸序列的多核苷酸; (e) 包含由序列表中SEQ ID N0: 14所示的核苷酸序列的多核苷酸; (f) 包含由序列表中SEQ ID N0: 10至14任一所表示的核苷酸序列的至少3000個連續(xù) 核苷酸的多核苷酸; (g) 包含由序列表中SEQ ID N0: 10至14任一所表示的核苷酸序列的至少2000個連續(xù) 核苷酸的多核苷酸; (h) 包含與根據(jù)上述(a)至(g)任一項的多核苷酸的核苷酸序列具有95%或更高同一 性的多核苷酸序列并具有增強外源基因表達的活性的多核苷酸;和 (i) 包含與根據(jù)上述(a)至(g)任一項的多核苷酸的核苷酸序列具有99%或更高同一 性的核苷酸序列并具有增強外源基因表達的活性的多核苷酸。
[0020] (13)已經(jīng)導入根據(jù)上述(11)或(12)的外源基因表達載體的轉(zhuǎn)化的細胞。
[0021] (14)已經(jīng)導入根據(jù)上述(11)或(12)的外源基因表達載體和元件載體(element vector)的轉(zhuǎn)化的細胞。
[0022] (15)根據(jù)上述(13)或(14)的轉(zhuǎn)化細胞,其中所述細胞是衍生自哺乳動物的培養(yǎng) 的細胞。
[0023] (16)根據(jù)所述(15)的轉(zhuǎn)化細胞,其中所述衍生自哺乳動物的培養(yǎng)的細胞是C0S-1 細胞、293細胞或CH0細胞。
[0024] (17)生產(chǎn)蛋白的方法,其特征在于包括培養(yǎng)根據(jù)上述(13)至(16)任一項的轉(zhuǎn)化 細胞并從所得的培養(yǎng)產(chǎn)物中獲得衍生自外源基因的蛋白。
[0025] (18)根據(jù)上述(1)至(6)任一項的多核苷酸用于在轉(zhuǎn)化細胞中表達外源基因的用 途。
[0026] (19)根據(jù)上述(11)至(12)的外源基因表達載體用于在轉(zhuǎn)化細胞中表達外源基因 的用途。
[0027] 本發(fā)明的有益效果 通過將使用本發(fā)明的衍生自人基因的啟動子的外源基因表達載體導入哺乳動物宿主 細胞,可以顯著增強治療性蛋白、抗體等的外源基因的表達。并且,通過組合DNA元件使用 本發(fā)明的啟動子,可以進一步增強治療性蛋白、抗體等的外源基因的表達。
[0028] 附圖簡述
[圖1]圖1顯示通過使用SEAP活性作為指標在轉(zhuǎn)染的CH0-K1多克隆細胞中評價啟動 子活性的圖。該圖顯示每個啟動子的SEAP活性,并且CMV啟動子的值歸一化為1。顯示了 兩個獨立實驗的結(jié)果(η = 3,平均值土 SD)。
[0029] [圖2]圖2顯示通過使用SEAP活性作為指標在轉(zhuǎn)染的CH0-K1多克隆細胞中評 價截短啟動子活性的圖。該圖顯示每個啟動子的活性,并且CMV啟動子的值歸一化為1 (η = 3,平均值土 SD)。
[0030] [圖3]圖3顯示其中通過擴增GAPDH區(qū)域證實進行芯片上ChIP (ChIP-on-chip) 的樣品特異性地與抗乙酰化組蛋白H3抗體染色質(zhì)免疫沉淀的圖。
[0031] [圖4]圖4顯示其中插入DNA元件的SEAP表達載體的示意圖。
[0032] [圖5]圖5顯示其中通過使用在轉(zhuǎn)染的CH0細胞系中CMV啟動子表達的SEAP的 活性作為指標證實的DNA元件A2、A7、A18、B5和C14的增強表達效果的圖。
[0033] [圖6]圖6顯示其中通過使用在轉(zhuǎn)染的CH0細胞系中EF-1 α或SV40啟動子表達 的SEAP的活性作為指標證實的DNA元件Α2和Α7的增強表達效果的圖。
[0034] [圖7]圖7顯示其中插入DNA元件的抗體表達(抗體基因 X重鏈和輕鏈共表達) 載體的示意圖。
[0035] [圖8]圖8顯示其中通過在轉(zhuǎn)染的CH0細胞系中使用CMV或EF-1 α啟動子表達 的抗體的生產(chǎn)水平(通過ELISA法測量)作為指標證實的DNA元件Α7的增強表達效果的圖。
[0036] [圖9]圖9是顯不DNA兀件A2和相關序列的序列長度的表。
[0037] [圖10]圖10顯示其中通過在轉(zhuǎn)染的CH0細胞系中使用SEAP的活性作為指標證 實的DNA元件A2和相關序列的增強表達效果的圖。
[0038] [圖11]圖11是顯示DNA元件A7和相關序列的序列長度的表。
[0039] [圖12]圖12顯示其中通過在轉(zhuǎn)染的CH0細胞系中使用SEAP的活性作為指標證 實的DNA元件A7和相關序列的增強表達效果的圖。
[0040] [圖13]圖13是顯示DNA元件A18和相關序列的序列長度的表。
[0041] [圖14]圖14顯示其中通過在轉(zhuǎn)染的CH0細胞系中使用SEAP的活性作為指標證 實的DNA元件A18和相關序列的增強表達效果的圖。
[0042] [圖15]圖15是顯不DNA兀件B5和相關序列的序列長度的表。
[0043] [圖16]圖16顯示其中通過在轉(zhuǎn)染的CH0細胞系中使用SEAP的活性作為指標證 實的DNA元件B5和相關序列的表達增強效果的圖。
[0044] [圖17]圖17是顯不DNA兀件C14和相關序列的序列長度的表。
[0045] [圖18]圖18顯示其中通過在轉(zhuǎn)染的CH0細胞系中使用SEAP的活性作為指標證 實的DNA元件C14和相關序列的表達增強效果的圖。
[0046] [圖19]圖19顯示其中通過在轉(zhuǎn)染的HEK293細胞系中使用SEAP的活性作為指標 證實的DNA元件A2、A7、A18、B5和C14的表達增強效果的圖。
[0047] [圖20]圖20是顯示在DNA元件A2、A7或A18的全長序列的基礎上在起始和終 止點的核苷酸的表。
[0048][圖21]圖21是顯示在DNA元件B5或C14的全長序列的基礎上在起始和終止點 的核苷酸的表。
[0049] 實施方案說明 在下文中,將對本發(fā)明進行具體的說明。
[0050] 如本文所用,術語"基因"是指被轉(zhuǎn)錄成mRNA和隨后翻譯成蛋白質(zhì)的區(qū)段,并且不 僅包括DNA,還包括其mRNA、其cDNA和其RNA。
[0051 ] 如本文所用,術語"多核苷酸"以與核酸相同的意義使用,并且還包括DNA、RNA、探 針、寡核苷酸和引物。
[0052] 如本文所用,術語"多肽"和"蛋白"的使用沒有區(qū)別。
[0053] 如本文所用術語"基因表達"指其中mRNA從基因轉(zhuǎn)錄的現(xiàn)象和/或其中蛋白從 mRNA翻譯的現(xiàn)象。
[0054] 如本文所用術語"外源基因"指人工導入宿主細胞的基因。
[0055] 如本文所用術語"外源蛋白"指由外源基因編碼的蛋白。
[0056] 如本文所用術語"基因表達單元"指在轉(zhuǎn)錄閱讀框的方向上具有至少啟動子區(qū)域、 外源基因和轉(zhuǎn)錄終止區(qū)域(多聚(A)附加信號)的多核苷酸。
[0057] 如本文所用術語"增強外源基因表達的活性"指通過產(chǎn)生有利于在包含外源基因 的基因表達單元周圍的任何DNA中轉(zhuǎn)錄的環(huán)境和顯著改善轉(zhuǎn)錄效率,增強外源蛋白在宿主 細胞中的產(chǎn)生的活性。
[0058] 如本文所用術語"啟動子"指在從DNA到RNA的轉(zhuǎn)錄起始中涉及的轉(zhuǎn)錄因子可以 結(jié)合的區(qū)域,并且在本說明書中有時稱作"啟動子區(qū)域"。啟動子的實例包括從位于轉(zhuǎn)錄起 始位點上游約2kbp的核苷酸開始并在緊接對應起始密碼子的核苷酸序列的上游核苷酸結(jié) 束的多核苷酸,并且啟動子可以包含5' -UTR和內(nèi)含子。
[0059] 如本文所用術語"啟動子活性"指其中轉(zhuǎn)錄因子結(jié)合啟動子并起始轉(zhuǎn)錄以產(chǎn)生基 因編碼的蛋白的活性。其可以通過使用由報告基因編碼的蛋白(例如分泌型堿性磷酸酶 (SEAP))的活性作為指標進行測定。
[0060] 如本文所用短語"具有啟動子活性"指如下文所述(實施例3)在相同條件下具有 等于或高于CMV啟動子的活性的表達SEAP的活性,以通過使用SEAP的表達水平作為指標 評價啟動子活性。
[0061] 如本文所用術語"DNA元件"指在多聚核苷酸位于基因表達單元的附近或在含有基 因表達單元的外源基因表達載體中的情況下,具有增強外源基因表達的活性的多核苷酸。 [0062] 如本文所用術語"抗體的功能片段",指具有抗原結(jié)合活性的抗體的部分片段,并 且包括Fab、F (ab')2等。但是,該術語不限于這些分子,只要片段對抗原具有結(jié)合親和性。 [0063] 如本文所用術語"同一性"指兩個或更多個核苷酸序列或氨基酸序列的序列之間 的關系,通過比較這些序列確定,如本領域已知。在本領域中,術語"同一性"還可以指核酸 分子間或多肽之間序列相關性的程度,如通過兩個或更多個核苷酸序列或兩個或更多個氨 基酸序列的串之間的匹配所確定??梢酝ㄟ^計算在具有缺口比對(如果有的話)的兩個或更 多個序列的最小者之間相同匹配的百分比評價"同一性",所述比對通過特定數(shù)學模型或計 算機程序(即"算法")進行。具體而言,可以通過使用軟件例如歐洲分子生物學實驗室-歐 洲生物信息研究所(EMBL-EBI)提供的ClustalW2評價同一性,但是軟件不限于其,并且可 以使用任何軟件,只要其是本領域技術人員所使用的。
[0064] 如本文所用短語"在嚴格條件下雜交"指在形成所謂的特異性雜交但是不形成非 特異性雜交的條件下的雜交。條件的實例包括這樣的條件,其中包含與另一個核酸具有80% 或更多,優(yōu)選90%或更多,更優(yōu)選95%或更多,最優(yōu)選99%或更多的同一性的核苷酸序列的 核酸的互補鏈雜交,但是包含具有更低同一性的核苷酸序列的核酸的互補鏈不雜交。更具 體地,其意味著在68°C,在可商購獲得的雜交液ExpressHyb雜交溶液(由Clontech, Inc. 制造)中實現(xiàn)雜交或在如下的條件下實現(xiàn)雜交:所述條件使得雜交在68°C,在0. 7至1. 0M NaCl的存在下進行,使用具有DNA固定于其上的濾器,然后在68°C使用0. 1至2 X SSC溶液 (lxSSC溶液由150mM NaCl和15mM檸檬酸鈉組成)洗滌,或在其等效條件下實現(xiàn)雜交。 [0065] 1.用于增強外源基因表達的啟動子 作為本發(fā)明的衍生自人基因的啟動子(下文有時也稱作"本發(fā)明的啟動子"),優(yōu)選從位 于轉(zhuǎn)錄起始位點上游約2kbp的核苷酸開始并在緊接對應人核糖體蛋白基因的起始密碼子 的核苷酸序列的上游核苷酸結(jié)束的多核苷酸。衍生自人基因的啟動子可以是從位于轉(zhuǎn)錄起 始位點上游約lkbp或約0. 5kbp的核苷酸開始并在緊接對應人核糖體蛋白基因的起始密碼 子序列的核苷酸序列的上游核苷酸結(jié)束的多核苷酸。
[0066] 人核糖體蛋白基因優(yōu)選為人核糖體蛋白S7基因(下文稱為"RPS7")、人核糖體蛋 白L32基因(下文稱為"RPL32")或人核糖體蛋白L34基因(下文稱為"RPL34")。
[0067] 本發(fā)明的啟動子優(yōu)選是RPS7、RPL32或RPL34的啟動子,更優(yōu)選是由序列表中任 意SEQ ID N0: 1-9所表示的多核苷酸,并且特別優(yōu)選由任意SEQ ID N0: 1-3所表示的多核苷 酸。
[0068] SEQ ID N0: 1、2和3的核苷酸序列是分別從位于轉(zhuǎn)錄起始位點上游約2kbp的核苷 酸開始并在緊接RPS7、RPL32和RPL34對應起始密碼子的核苷酸序列的上游核苷酸結(jié)束的 多核苷酸。SEQ ID N0: 4、6和8的核苷酸序列是分別從位于轉(zhuǎn)錄起始位點上游約lkbp的核 苷酸開始并在緊接RPS7、RPL32和RPL34對應起始密碼子的核苷酸序列的上游核苷酸結(jié)束 的多核苷酸。SEQ ID N0: 5、7和9的核苷酸序列是分別從位于轉(zhuǎn)錄起始位點上游約0. 5kbp 的核苷酸開始并在緊接RPS7、RPL32和RPL34對應起始密碼子的核苷酸序列的上游核苷酸 結(jié)束的多核苷酸。
[0069] 此外,本發(fā)明的啟動子可以是包含與SEQ ID N0: 1-9表示的任一核苷酸序列具有 80%或更多,優(yōu)選90%或更多,更優(yōu)選95%或更多,最優(yōu)選99%或更多同一性的核苷酸序列的 多核苷酸,并且具有啟動子活性。
[0070] 本發(fā)明的啟動子可以是這樣的多核苷酸,其在嚴格條件下雜交到包括與包含選自 由SEQ ID N0: 1-9表示的核苷酸序列的任一核苷酸序列的多核苷酸互補的核苷酸序列的多 核苷酸,并具有啟動子活性。
[0071] 本發(fā)明的啟動子可以是這樣的多核苷酸,其是包含其中一個或多個,優(yōu)選1至 300,更優(yōu)選1至30個核苷酸已被缺失、取代和/或添加的核苷酸的突變的多核苷酸,并具 有啟動子活性,所述突變在選自由SEQ ID N0: 1-9表示的核苷酸序列的任一核苷酸序列中。
[0072] 將突變(缺失、取代和/或添加)導入上述核苷酸序列可以通過本領域已知的方法, 例如Kunkel法或缺口雙鏈體法或等效的方法進行。例如,可以使用利用定點誘變法的突變 導入試劑盒,例如突變-K(TaKaRaBio, Inc.制造)或突變-G(TaKaRaBio, Inc.制造 ),LA PCR體外誘變系列試劑盒(TaKaRaBio, Inc.制造)。這樣的突變的多核苷酸也可以用作本 發(fā)明的啟動子。
[0073] 增強外源基因表達的本發(fā)明的啟動子的活性可以通過使用由報告基因所編碼的 蛋白如SEAP的活性作為指標來測定。在下列情況下,其中當使用本發(fā)明的啟動子時報告 蛋白的活性等于或高于使用CMV啟動子時,優(yōu)選地,活性增加1. 2倍或更高,更優(yōu)選1. 5倍 或更高,所述啟動子可以判斷為具有增強外源基因表達的活性。即使在其中活性增加約1. 2 倍或更高的情況下,預期這將減少細胞培養(yǎng)規(guī)模、細胞培養(yǎng)時間和純化步驟,使其可能增加 產(chǎn)量并減少細胞培養(yǎng)成本。如果產(chǎn)量增加,則可能穩(wěn)定地提供用作藥物產(chǎn)品的外源蛋白。另 夕卜,如果細胞培養(yǎng)成本減少,用作藥物產(chǎn)品的外源蛋白的成本也減少。
[0074] 并且,本發(fā)明的啟動子還可以通過使用本領域技術人員熟知的方法將啟動子導入 宿主細胞,用于增強宿主細胞的內(nèi)源基因的表達。
[0075] 2.外源基因表達單元 本發(fā)明的外源基因表達單元(以下有時也稱為"本發(fā)明的基因表達單元")在轉(zhuǎn)錄閱讀 框的方向上,至少具有在上述項目"1"中所述的本發(fā)明的啟動子、外源基因和轉(zhuǎn)錄終止區(qū) (多聚(A)附加信號)。
[0076] 另外,多聚(A)附加信號可以是對從啟動子的轉(zhuǎn)錄具有導致轉(zhuǎn)錄終止活性的序列, 并且可以是來自與所述啟動子的基因相同或不同的基因的序列。
[0077] 3.用于增強外源基因表達的DNA元件 通過使用在上面的項目"2"中所述本發(fā)明的基因表達單元并組合DNA元件,可以進一 步增強外源基因的表達。如實施例6所述,可以通過使用乙酰化組蛋白H3和元件之間的相 互作用作為指標獲得組合使用的DNA元件。通常,據(jù)說組蛋白(H3和H4)的乙?;c轉(zhuǎn)錄 激活相關,并且有兩大理論已被提倡。一個理論是,組蛋白的乙?;c核小體構(gòu)象的變化 相關,所述變化方式使得組蛋白尾部被乙?;员惚浑娭泻?,減弱DNA-組蛋白的相互作用 (Mellor J. (2006) Dynamic nucleosomes and gene transcription. Trends Genet. 22(6): 320-329)。另一個理論是組蛋白的乙?;c多種轉(zhuǎn)錄因子的募集有關(Nakatani Y. (2001) Histone acetylases-versatile players. Genes Cells. 6 (2) : 79-86)。根據(jù)任一理論,非 ??赡艿氖墙M蛋白的乙酰化與轉(zhuǎn)錄激活有關,并且通過使用抗乙?;M蛋白H3抗體進行 染色質(zhì)免疫沉淀(ChIP),可以濃縮與乙?;慕M蛋白H3相互作用的DNA元件。
[0078] A2是與本發(fā)明的啟動子組合使用以增強外源基因表達的DNA元件的實例。A2位 于人染色體15的80966429至80974878的區(qū)域,并且是具有62. 2%的AT含量的8450bp多 核苷酸。A2的核苷酸序列由序列表中SEQ ID N0: 10表示。
[0079] A7、A18、B5和C14是類似DNA元件的實例。A7位于人染色體11的88992123至 89000542的區(qū)域,并且是具有64. 52%的AT含量的8420bp多核苷酸。A7的核苷酸序列由 序列表中SEQ ID N0: 11表不。
[0080] A18位于人染色體4的111275976至111284450的區(qū)域,并且是具有62. 54%的AT 含量的8475bp多核苷酸。A18的核苷酸序列由序列表中SEQ ID NO: 12表示。
[0081] B5位于人染色體1的143034684至143043084的區(qū)域,并且是具有66. 37%的AT 含量的8401bp多核苷酸。B5的核苷酸序列由序列表中SEQ ID NO: 13表示。
[0082] 最后,C14位于人染色體11的46089056至46097482的區(qū)域,并且是具有63. 81% 的AT含量的8427bp多核苷酸。C14的核苷酸序列由序列表中SEQ ID N0: 14表示。
[0083] 與本發(fā)明啟動子組合使用的DNA元件的增強外源基因表達的活性可以通過使用 由報告基因所編碼的蛋白如SEAP的活性作為指標來測定。
[0084] 在其中DNA元件與本發(fā)明的啟動子組合使用的情況下,可以單獨使用任一上述 DNA元件,或者可以使用DNA元件的一種類型的兩個或更多個拷貝?;蛘?,可以組合使用兩 種或更多種不同類型的上述DNA元件。
[0085] A2、A7、A18、B5和C14是與本發(fā)明的啟動子組合使用的DNA元件的優(yōu)選的實例。
[0086] 本發(fā)明中使用的DNA元件可以是包含與SEQ ID N0: 10-14表示的任意核苷酸序列 具有80%或更多,優(yōu)選90%或更多,更優(yōu)選95%或更多,最優(yōu)選99%或更多同一性的核苷酸 序列的核苷酸序列,并且具有增強外源基因表達的活性。可以相對例如日本的DNA數(shù)據(jù)庫 等,使用程序例如FASTA或BLAST進行核苷酸序列同源性檢索。
[0087] 與本發(fā)明的啟動子組合使用的DNA元件可以是這樣的DNA元件,其在嚴格條件下 雜交到包括與包含選自由SEQ ID N0: 10-14表示的核苷酸序列的核苷酸序列的多核苷酸互 補的核苷酸序列的多核苷酸,并具有增強外源基因表達的活性。
[0088] 參考 Molecular Cloning (Sambrook, J.等,Molecular Cloning: a Laboratory Manual 2nd ed. , Cold Spring Harbor Laboratory Press, 10 Skyline Drive Plainview, N.Y. (1989))等,本領域技術人員可以容易地獲得這樣的同源基因。并且,可以通過以相同 的方式進行FASTA檢索或BLAST檢索確定上述核苷酸序列的同一性。
[0089] 將突變(缺失、取代和/或添加)導入上述多核苷酸可以通過本領域已知的方法,例 如Kunkel法或缺口雙鏈體法或等效的方法進行。例如,可以使用利用定點誘變法的突變導 入試劑盒,例如突變-K (TaKaRaBio,Inc.制造)、突變-G (TaKaRaBio,Inc.制造)或LA PCR體外誘變系列試劑盒(TaKaRaBio, Inc.制造)等。這樣的突變的多核苷酸也可以用作 本發(fā)明的DNA元件。
[0090] 作為與本發(fā)明的啟動子組合使用的DNA元件,可以使用包含序列表中SEQ ID N0: 10-14任一表示的核苷酸序列的至少3000或至少2000個連續(xù)核苷酸的部分片段。這樣的 部分片段的實例包括:A2-1至A2-17,其是A2的部分片段;A7-1至A7-18,其是A7的部分 片段;A18-1至A18-4,其是A18的部分片段;B5-1至B5-6,其是B5的部分片段;以及C14-1 至C14-14,其是C14的部分片段。但是,所述DNA元件不限于這些部分片段,只要其具有增 強外源基因表達的活性。
[0091] 在本發(fā)明中,可以單獨使用任一上述部分片段,并且也可以使用所述部分片段的 一種類型的兩個或更多個拷貝?;蛘撸梢越M合使用兩種或更多種不同類型的部分片段。此 夕卜,可以組合使用全長序列和任意上述DNA元件的部分片段。在上述組合中,所述全長序列 和部分片段可以衍生自相同的DNA元件或衍生自不同的DNA元件。
[0092] 對于A2的相應片段的多核苷酸序列,A2-1對應序列表中SEQ ID N0: 10的核苷酸1 至3000的多核苷酸序列;A2-2對應序列表中SEQ ID N0: 10的核苷酸2801至5800的多核 苷酸序列;A2-3對應序列表中SEQ ID N0: 10的核苷酸5401至8450的多核苷酸序列;A2-4 對應序列表中SEQ ID N0: 10的核苷酸701至2700的多核苷酸序列;A2-5對應序列表中SEQ ID N0: 10的核苷酸701至2200的多核苷酸序列;A2-6對應序列表中SEQ ID N0: 10的核苷 酸701至3700的多核苷酸序列;A2-7對應序列表中SEQ ID NO: 10的核苷酸2001至5000 的多核苷酸序列;A2-8對應序列表中SEQ ID NO: 10的核苷酸4001至7000的多核苷酸序 列;A2-9對應序列表中SEQ ID NO: 10的核苷酸1至3700的多核苷酸序列;A2-10對應序 列表中SEQ ID NO: 10的核苷酸2001至5800的多核苷酸序列;A2-11對應序列表中SEQ ID NO: 10的核苷酸2801至7000的多核苷酸序列;A2-12對應序列表中SEQ ID NO: 10的核苷 酸701至5800的多核苷酸序列;A2-13對應序列表中SEQ ID NO: 10的核苷酸2001至7000 的多核苷酸序列;A2-14對應序列表中SEQ ID NO: 10的核苷酸2801至8450的多核苷酸序 列;A2-15對應序列表中SEQ ID NO: 10的核苷酸1至5800的多核苷酸序列;A2-16對應序 列表中SEQ ID NO: 10的核苷酸701至7000的多核苷酸序列;A2-17對應序列表中SEQ ID NO: 10的核苷酸2001至8450的多核苷酸序列。
[0093] 對于A7的相應片段的多核苷酸序列,A7-1對應序列表中SEQ ID N0: 11的核苷酸 601至3600的多核苷酸序列;A7-2對應序列表中SEQ ID N0: 11的核苷酸3601至8420的 多核苷酸序列;A7-3對應序列表中SEQ ID N0: 11的核苷酸5401至8420的多核苷酸序列; A7-4對應序列表中SEQ ID N0: 11的核苷酸3401至6400的多核苷酸序列;A7-5對應序列表 中SEQ ID N0: 11的核苷酸1501至4500的多核苷酸序列;A7-6對應序列表中SEQ ID N0: 11 的核苷酸4401至7400的多核苷酸序列;A7-7對應序列表中SEQ ID NO: 11的核苷酸2401 至5400的多核苷酸序列;A7-8對應序列表中SEQ ID NO: 11的核苷酸1至3600的多核苷 酸序列;A7-9對應序列表中SEQ ID N0: 11的核苷酸1501至5400的多核苷酸序列;A7-10 對應序列表中SEQ ID N0: 11的核苷酸2401至6400的多核苷酸序列;A7-11對應序列表中 SEQ ID N0: 11的核苷酸3401至7400的多核苷酸序列;A7-12對應序列表中SEQ ID N0: 11 的核苷酸4401至8420的多核苷酸序列;A7-13對應序列表中SEQ ID NO: 11的核苷酸1至 5400的多核苷酸序列;A7-14對應序列表中SEQ ID N0: 11的核苷酸1501至6400的多核苷 酸序列;A7-15對應序列表中SEQ ID N0: 11的核苷酸2401至7400的多核苷酸序列;A7-16 對應序列表中SEQ ID N0: 11的核苷酸3401至8420的多核苷酸序列;A7-17對應序列表中 SEQ ID N0: 11的核苷酸1至6400的多核苷酸序列;A7-18對應序列表中SEQ ID N0: 11的 核苷酸1501至7400的多核苷酸序列。
[0094] 對于A18的相應片段的多核苷酸序列,A18-1對應序列表中SEQ ID N0: 12的核苷 酸1至5040的多核苷酸序列;A18-2對應序列表中SEQ ID NO: 12的核苷酸1001至6002的 多核苷酸序列;A18-3對應序列表中SEQ ID N0: 12的核苷酸2001至7000的多核苷酸序列; A18-4對應序列表中SEQ ID N0: 12的核苷酸3000至7000的多核苷酸序列。
[0095] 對于B5的相應片段的多核苷酸序列,B5-1對應序列表中SEQ ID N0: 13的核苷酸 1至4001的多核苷酸序列;B5-2對應序列表中SEQ ID N0: 13的核苷酸1至3200的多核苷 酸序列;B5-3對應序列表中SEQ ID N0: 13的核苷酸2491至5601的多核苷酸序列;B5-4對 應序列表中SEQ ID N0: 13的核苷酸5373至8401的多核苷酸序列;B5-5對應序列表中SEQ ID N0: 13的核苷酸901至4001的多核苷酸序列;B5-6對應序列表中SEQ ID N0: 13的核苷 酸4001至7000的多核苷酸序列。
[0096] 對于C14的相應片段的多核苷酸序列,C14-1對應序列表中SEQ ID N0: 14的核苷 酸960至4015的多核苷酸序列;C14-2對應序列表中SEQ ID NO: 14的核苷酸1987至5014 的多核苷酸序列;C14-3對應序列表中SEQ ID N0: 14的核苷酸4020至7119的多核苷酸序 列;C14-4對應序列表中SEQ ID NO: 14的核苷酸960至8141的多核苷酸序列;C14-5對應 序列表中SEQ ID NO: 14的核苷酸960至6011的多核苷酸序列;C14-6對應序列表中SEQ ID NO: 14的核苷酸4939至8141的多核苷酸序列;C14-7對應序列表中SEQ ID NO: 14的核苷 酸960至5014的多核苷酸序列;C14-8對應序列表中SEQ ID NO: 14的核苷酸2994至7119 的多核苷酸序列;C14-9對應序列表中SEQ ID NO: 14的核苷酸4020至8141的多核苷酸序 列;C14-10對應序列表中SEQ ID NO: 14的核苷酸1至5014的多核苷酸序列;C14-11對應 序列表中SEQ ID NO: 14的核苷酸1987至7119的多核苷酸序列;C14-12對應序列表中SEQ ID NO: 14的核苷酸2994至8141的多核苷酸序列;C14-13對應序列表中SEQ ID NO: 14的 核苷酸960至7119的多核苷酸序列;C14-14對應序列表中SEQ ID NO: 14的核苷酸1987至 8141的多核苷酸序列。
[0097] 4.多核苷酸的獲得 在本發(fā)明中,可通過下述普通方法獲得包含編碼外源蛋白(其產(chǎn)量待增加,這將在稍后 描述)的外源基因的多核苷酸。例如,可以通過使用從外源基因片段合成的DNA探針篩選衍 生自表達外源蛋白的細胞或組織的cDNA文庫分離這樣的多核苷酸。因此可以通過本領域 常規(guī)使用的方法制備mRNA。例如,用胍試劑、酚試劑等處理細胞或組織,由此獲得總RNA,并 且從而通過親和柱法使用寡(dT)纖維素柱或包含瓊脂糖2B等的聚U-瓊脂糖柱作為載體, 或通過分批法獲得聚(A) + RNA (mRNA)。并且,多聚(A)+RNA可以通過蔗糖密度梯度離心等 進一步分級。然后,使用這樣獲得的mRNA作為模板、寡dT引物和反轉(zhuǎn)錄酶合成單鏈cDNA。 從這樣獲得的單鏈cDNA,使用DNA聚合酶I、DNA連接酶、RNA酶Η等合成雙鏈cDNA。使用 T4 DNA聚合酶鈍化這樣合成的雙鏈cDNA,隨后連接到適體(例如EcoRI適體),磷酸化等,并 且所得的DNA摻入λ噬菌體例如Agtll以實現(xiàn)體內(nèi)包裝,由此制備cDNA文庫。還可以使 用質(zhì)粒載體代替λ噬菌體制備cDNA文庫。此后,可以從cDNA文庫選擇包含目標DNA的克 ?。栃钥寺?。
[0098] 在其中上述的啟動子,含有終止子區(qū)域的多核苷酸,上述的DNA元件,或包含用于 生產(chǎn)蛋白的外源基因的多核苷酸從基因組DNA中分離的情況下,根據(jù)常規(guī)方法(Molecular Cloning (1989),Methods in Enzymology 194 (1991)),基因組 DNA 從要用作收集來源 的生物體的細胞系中提取,并且選擇和分離所述多核苷酸??梢愿鶕?jù)例如Cryer等的方 法(Methods in Cell Biology, 12,39-44 (1975))或 P. Philippsen 等的方法(Methods Enzymol·,194,169-182 (1991))進行基因組 DNA 的提取。
[0099] 也可以通過例如 PCR 法(PCR Technology. Henry A. Erlich, Atockton press (1989))獲得目標啟動子、DNA元件或包含外源基因的多核苷酸。在使用PCR法的多核苷酸 的擴增中,使用20至30聚體的合成單鏈DNA作為引物并使用基因組DNA作為模板。在證 實基因的多核苷酸序列后,使用擴增的基因。作為PCR的模板,可以使用基因組DNA文庫, 例如細菌人工染色體(BAC)-文庫。
[0100] 另一方面,可以通過(a)根據(jù)常規(guī)方法制備基因文庫,和(b)從制備的基因文庫選 擇所希望的多核苷酸并擴增所述多核苷酸來獲得包含未知序列的多核苷酸??梢酝ㄟ^如 下獲得基因文庫:部分消化通過常規(guī)方法從用作收集來源的生物體的細胞系獲得的染色體 DNA,使用適當?shù)南拗菩悦竵硎谷旧wDNA片段化,將所獲得的片段連接到適當?shù)妮d體上, 并將載體導入適當?shù)乃拗?。還可以通過從細胞提取mRNA,從mRNA合成cDNA,將cDNA連接 到適當?shù)妮d體并將載體導入適當?shù)乃拗鱽碇苽浠蛭膸?。作為用于該制備的載體,可以使 用通常已知作為用于基因文庫制備的載體的質(zhì)粒,并且也可以使用噬菌體載體、粘粒等。作 為要轉(zhuǎn)化或轉(zhuǎn)染的宿主,可以使用適合用于上述載體類型的宿主。通過菌落雜交法、噬菌斑 雜交法等使用包含對外源基因特異性的序列的標記探針從上述基因文庫選擇包含外源基 因的多核苷酸。
[0101] 此外,還可以通過總化學合成生產(chǎn)包含外源基因的多核苷酸。例如,可以通過下列 方法合成基因:其中制備并退火兩對互補寡核苷酸的方法,其中通過DNA連接酶連接幾個 退火的DNA鏈的方法,其中制備幾個部分互補的寡核苷酸并通過PCR填平缺口的方法,等 等。
[0102] 可以通過常規(guī)技術,例如雙脫氧法(Sanger等,Proc. Natl. Acad. Sci.,USA, 74, 5463-5467 (1977))等進行多核苷酸序列的確定。還可以使用可商購獲得的測序試劑 盒等容易地進行多核苷酸序列的上述確定。
[0103] 5.外源基因表達載體、元件載體 作為本發(fā)明的外源基因表達載體,提供了包含在上述項目"2"中所述的外源基因表達 單元的載體,所述外源基因表達單元包含上述項目"1"中所述本發(fā)明的啟動子。本發(fā)明的 外源基因表達載體可以包含一種類型的上述項目"3"中所述的DNA元件,上述DNA元件的 一種類型的兩個或更多個拷貝,或組合的上述DNA元件的兩種或更多種不同類型。當使用 上述外源基因表達載體在宿主細胞中表達外源基因時,DNA元件可以位于所述基因表達單 元的緊接的上游或下游,或可以位于遠離所述基因表達單元的位置。此外,可以使用包含多 個這樣的DNA元件的一個外源基因表達載體。順便提及,所述DNA元件可以關于所述基因 表達單元的正向或反向插入。
[0104] 此外,作為本發(fā)明中使用的載體,還包括這樣的載體,其包含一種類型的上述DNA 元件、上述DNA元件的一種類型的兩個或更多個拷貝或組合的兩種或更多種類型的上述 DNA元件,且不包含基因表達單元(下文也稱為"元件載體")。這樣的元件載體可以組合包 含所述DNA元件的上述外源基因表達載體,或不包含DNA元件并僅包含外源基因表達單元 的外源基因表達載體使用。通過允許所述元件載體與所述外源基因表達載體共存,相比其 中單獨使用外源基因表達載體的情況,外源基因的表達得到增強,并且因此,上述載體的組 合也包括在本發(fā)明的外源基因表達載體內(nèi)。
[0105] 外源基因沒有特別限制,但其實例包括報告基因,如分泌型堿性磷酸酶(SEAP)、綠 色熒光蛋白(GFP)和熒光素酶的基因;各種酶的基因,如α-淀粉酶基因和α-半乳糖苷酶 基因;各種干擾素的基因,其是藥學上有用的和生理活性的蛋白,如干擾素 α和干擾素 Υ ; 各種白細胞介素的基因,如IL-1和IL-2 ;各種細胞因子基因,如促紅細胞生成素(ΕΡ0)基因 和粒細胞集落刺激因子(G-CSF)基因;生長因子基因;和編碼多聚體蛋白的基因如編碼抗 體或其功能片段異源多聚體的基因。這些基因可以通過任何方法獲得。
[0106] "抗體的功能片段"指具有抗原結(jié)合活性的抗體的部分片段,并包括Fab、F(ab')2、 Fv、scFv、雙抗體、線性抗體、抗體片段形成的多特異性抗體等等??贵w的功能片段還包括 Fab',其是通過在還原條件下處理F(ab')2獲得的抗體的可變區(qū)的單價片段。但是,所述功 能片段不限于這些分子,只要所述片段對抗原具有結(jié)合親和性。此外,這些功能片段不僅包 括通過用適當?shù)拿柑幚砜贵w蛋白的全長分子獲得的片段,還包括使用遺傳修飾的抗體基因 在適當?shù)乃拗骷毎挟a(chǎn)生的蛋白。
[0107] 此外,本發(fā)明的外源基因表達載體和元件載體可以各自包含選擇標志物用于選擇 轉(zhuǎn)化子。例如,通過使用抗生素抗性標志物(其賦予對抗生素如淺藍菌素、短梗霉素、博來霉 素、刀豆氨酸、環(huán)己酰亞胺、潮霉素、嘌呤霉素、殺稻瘟菌素、四環(huán)素、卡那霉素、氨芐青霉素 或新霉素的抗性),可以選擇轉(zhuǎn)化體。此外,當使用賦予對溶劑如乙醇的抗性,對甘油、鹽等 的滲透壓的抗性,對金屬離子如銅離子等的抗性的基因作為標志物時,也可以選擇轉(zhuǎn)化子。
[0108] 本發(fā)明的外源基因表達載體和元件載體可以各自是不摻入染色體DNA的載體。通 常,外源基因表達載體轉(zhuǎn)染進入宿主細胞,并此后隨機摻入染色體。但是,通過使用衍生自 哺乳動物病毒例如猿猴病毒40 (SV40)、乳頭瘤病毒(BPV,HPV)或EBV的組成型組分,載體 可以用作附加體載體,其在轉(zhuǎn)染的宿主細胞中自我復制。例如,廣泛使用含有SV40衍生的 復制原點和編碼SV40大T抗原的序列(其是反式作用因子)的載體,含有EBV衍生的oriP 的載體和編碼EBNA-1的序列的載體等。DNA元件可以有效地展示增強外源基因表達的活 性,無論載體的類型如何或其是否整合入染色體。
[0109] 6.轉(zhuǎn)化的細胞 本發(fā)明的轉(zhuǎn)化的細胞是上述項目"5"中所述外源基因表達載體已導入其中的轉(zhuǎn)化細 胞。作為外源基因表達載體,(A)可以僅導入不包含DNA元件的外源基因表達載體,或(B) 可以組合導入不包含DNA元件的外源基因表達載體和元件載體。可選地,(C)可以導入包 含DNA元件的外源基因表達載體,或(D)可以組合導入包含DNA元件的外源基因表達載體 和元件載體。
[0110] 在宿主細胞中可以通過上述(B)或(D)中所述的組合進行外源基因的表達,根據(jù) 例如 Girod 等的方法(Biotechnology and Bioengineering, 91,2-11 (2005))和 Otte 等的 方法(Biotechnol. Prog·, 2007, 23, 801-807 (2007))。
[0111] 轉(zhuǎn)化的宿主細胞的實例可以包括真核細胞,其優(yōu)選的實例包括哺乳動物細胞,并 且更優(yōu)選的實例包括衍生自人、小鼠、大鼠、倉鼠、猴或牛的細胞。這樣的哺乳動物細胞的實 例包括C0S-1細胞、293細胞和CH0細胞(CH0-K1、DG44、CH0 dhfr-、CH0-S),但是宿主細胞 不限于其。
[0112] 在本發(fā)明中,可以使用任何方法將表達載體導入宿主細胞,只要該方法允許導入 的基因穩(wěn)定地存在于所述宿主細胞中,并在其中充分表達。通常使用的方法的實例包括 憐酸?丐法(Ito 等,(1984) Agric. Biol. Chem·,48,341)、電穿孔法(Becker, D. M.等, 1990; Methods. Enzymol·,194,182-187)、原生質(zhì)體法(Creggh 等,Mol. Cell. Biol·, 5, 3376 (1985))、醋酸鋰法(Ito, Η· (1983) J. Bacteriol. 153,163-168)和脂質(zhì)體轉(zhuǎn)染法。
[0113] 7.產(chǎn)生外源蛋白的方法 在本發(fā)明中,可以通過下列產(chǎn)生外源蛋白:通過已知方法培養(yǎng)上述項目"6"中所述轉(zhuǎn) 化的細胞(其中已導入編碼外源蛋白的基因),從所得培養(yǎng)產(chǎn)物中收集蛋白,隨后純化蛋白。 如本文所用術語"培養(yǎng)產(chǎn)物"除了培養(yǎng)上清液之外還指培養(yǎng)的細胞或細胞勻漿。順便提及, 作為可使用上述項目"6"中所述轉(zhuǎn)化細胞產(chǎn)生的外源蛋白,不僅可以選擇單體蛋白,還可以 選擇多聚體蛋白。在其中產(chǎn)生多個不同的亞基形成的異源多聚體蛋白的情況下,有必要分 別向上述項目"6"所述宿主細胞中導入多個編碼這些亞基的基因。
[0114] 培養(yǎng)轉(zhuǎn)化細胞的方法可以根據(jù)用于培養(yǎng)宿主細胞的常規(guī)方法進行。
[0115] 在其中轉(zhuǎn)化細胞是哺乳動物細胞的情況下,所述細胞在下列條件下培養(yǎng),例如 37°C和5%或8% C02,進行約24至1000小時的培養(yǎng)時間??梢酝ㄟ^分批培養(yǎng)、補料分批培 養(yǎng)、連續(xù)培養(yǎng)等在靜置、搖動、攪拌或通氣條件下進行培養(yǎng)。
[0116] 編碼來自上述培養(yǎng)產(chǎn)物(培養(yǎng)溶液)的外源蛋白的基因的表達產(chǎn)物的確認可以通 過SDS-PAGE、West ern分析、ELISA等進行。為了分離并純化所產(chǎn)生的蛋白,可以使用常規(guī)蛋 白分離和純化方法。完成培養(yǎng)后,在其中目標蛋白在細胞內(nèi)產(chǎn)生的情況下,使用超聲波勻漿 器、弗氏細胞壓碎器、Manton-Gaulin勻漿器、DYN0-MILL等使細胞勻漿,從而獲得靶蛋白。 另外,在其中目標蛋白在細胞外產(chǎn)生的情況下,同樣地使用培養(yǎng)溶液,或者通過離心等去除 細胞。此后,通過提取等,使用有機溶劑收集目標蛋白,并且然后可以通過使用下列技術分 離并純化收集的目標蛋白,例如各種層析技術(疏水層析、反相層析、親和層析、離子交換層 析等),使用分子篩的凝膠過濾,或使用聚丙烯酰胺凝膠的電泳等,根據(jù)需要單獨或者組合。
[0117] 上述培養(yǎng)方法和純化方法僅為實例,并且所述方法不限于其??梢酝ㄟ^已知的氨 基酸分析技術例如使用Edman降解方法的自動氨基酸測序確認純化的基因產(chǎn)物的氨基酸 序列。
[0118] 8.產(chǎn)生抗體蛋白的方法 作為使用上述項目"7"中所述的生產(chǎn)方法產(chǎn)生的異源多聚體蛋白,抗體蛋白可以作為 示例。抗體蛋白是四聚體蛋白,其包含兩個重鏈多肽分子和兩個輕鏈多肽分子。因此,為了 獲得以維持抗原結(jié)合親和性狀態(tài)的這樣的抗體蛋白,有必要將重鏈和輕鏈基因?qū)肷鲜鲰?目"6"中所述的轉(zhuǎn)化細胞。在這種情況下,所述重鏈和輕鏈基因表達單元可以存在于相同 的表達載體或不同的表達載體上。
[0119] 作為在本發(fā)明中產(chǎn)生的抗體,通過用所希望的抗原免疫實驗動物例如兔子、小鼠 或大鼠制備的抗體可以作為示例。并且,通過使用上述抗體作為起始材料獲得的嵌合抗體 和人源化抗體也可以作為本發(fā)明產(chǎn)生的抗體的示例。并且,使用遺傳修飾的動物或噬菌體 展示方法獲得的人抗體也包括在本發(fā)明產(chǎn)生的抗體中。
[0120] 產(chǎn)生抗體所使用的抗體基因不限于具有特定多核苷酸序列的抗體基因,只要從所 述抗體基因轉(zhuǎn)錄和翻譯的重鏈多肽和輕鏈多肽的組合具有結(jié)合給定抗原蛋白的活性。
[0121] 并且,不一定所述抗體基因編碼所述抗體的全長分子,并且可以使用編碼所述抗 體的功能片段的基因。這樣的編碼其功能片段的基因可以通過遺傳修飾編碼所述抗體蛋白 的全長分子的基因來獲得。
[0122] 9.用于其它外源蛋白的生產(chǎn)方法 除了上述抗體之外,使用本發(fā)明的生產(chǎn)方法產(chǎn)生的外源蛋白的實例還包括,各種衍生 自人或非人的蛋白、其功能片段和其修飾的產(chǎn)物。這樣的蛋白等的實例包括肽類激素,如 心房利鈉肽(ANP)、腦鈉肽(BNP)、C-型鈉尿肽(CNP)、加壓素、促生長素抑制素、生長激素 (GH)、胰島素、催產(chǎn)素、生長素釋放肽、瘦素、脂聯(lián)素、腎素、降血鈣素、骨保護素和胰島素樣 生長因子(IGF);細胞因子,如白細胞介素、趨化因子、干擾素、腫瘤壞死因子(如TNF-α、 TNF-β和TNF超家族)、神經(jīng)生長因子(例如NGF)、細胞生長因子(如EGF、FGF、H)GF、HGF和 TGF)、造血生長因子(如CSF、G-CSF和促紅細胞生成素)和脂肪細胞因子;受體如TNF受體; 酶,如溶菌酶、蛋白酶、蛋白水解酶和肽酶;其功能片段(具有部分或全部的原始蛋白的生物 活性的片段)和包括任何這些蛋白的融合蛋白。但是,所述蛋白不限于其。 實施例
[0123] 10.實施例 在下文中,本發(fā)明將具體參照實施例進行描述。但是,這些實施例不限制本發(fā)明的技術 范圍。用于本發(fā)明的實施例的質(zhì)粒、限制性酶、DNA修飾酶等是可商購獲得的產(chǎn)品并且可以 根據(jù)常規(guī)方法使用。此外,用于DNA克隆、多核苷酸測序、宿主細胞轉(zhuǎn)化、轉(zhuǎn)化的宿主細胞的 培養(yǎng)、從所得培養(yǎng)產(chǎn)物的蛋白收集、蛋白純化等的方法也可以是本領域技術人員熟知的并 可以見于文獻。
[0124] (實施例1)用于評價啟動子活性的載體CMV/pSeapIRESpuro的構(gòu)建 通過使用SEAP的表達作為指標進行啟動子活性的評價,并且構(gòu)建用于評價的載體。
[0125] 1-1)通過PCR的SEAP的cDNA的擴增和限制性酶位點的添加 通過PCR擴增SEAP的cDNA,使用其中在緊接起始密碼子上游添加 Nhel位點并在緊接 終止密碼子下游添加 Bglll位點的引物和KOD-Plus-(TOYOBO)。作為模板,使用pSEAP2-對 照(Clontech)。所獲得的片段用Nhel和Bglll消化并然后使用MinElute反應試劑盒 (Qiagen)純化。
[0126] 所使用的引物: SEAPF: AAAGCTAGCA7GCTGCTGCTGCTGCTGCTGCTGGGCC SEAPR: AAAAGATCTTCATGTCTGCTCGAAGCGGCCG6CCGC
[0127] 1-2) CMV/pSeapIRESpuro 的構(gòu)建 pIRESpuro3 (Clontech)載體用Nhel和BamHI消化后,通過連接反應將1-1)中制備的 SEAP片段整合在其中。所獲得的質(zhì)粒命名為"CMV/pSeapIRESpuro"。
[0128] (實施例2) RPS7、RPL32和RPL34的啟動子區(qū)域的克隆 作為認為包含具有高轉(zhuǎn)錄活性的啟動子的人基因,通過使用mRNA水平作為指標選擇 EEF2、YBX1、PPIA、PSAP、RAN、PRL32、PRL34、RPLP1、RPS7、RPS24、TMSB4X、UBC、YWHAE、ARPC2 和SERBP1,并且進行每個基因的啟動子區(qū)域的克隆。所獲得的質(zhì)粒用于實施例3中啟動子 活性的評價。
[0129] 2-1) RPS7的啟動子區(qū)域的克隆 作為RPS7的啟動子區(qū)域,關于GenBank中登錄號NM_001011. 3下登記的mRNA序列,使 用從位于RPS7的轉(zhuǎn)錄起始位點的上游約2kbp的核苷酸起始,并在緊接對應RPS7的起始密 碼子序列的核苷酸序列的上游的核苷酸結(jié)束的序列。
[0130] 通過PCR使用大腸桿菌人工染色體克隆RP11-644P19 (GenoTechs)作為模板擴增 RPS7的啟動子區(qū)域,并且還使用下列引物組和K0D -Plus- (Τ0Υ0Β0),并然后使用MinElute 反應試劑盒(Qiagen)純化。在CMV/pSeapIRESpuro用Spel和Nhel消化并去除CMV啟動 子后,使用 In-Fusion Advantage PCR 克隆試劑盒(Clontech)在 Spel-Nhel 位點整合 RPS7 的啟動子區(qū)域,由此構(gòu)建RPS7/pSeapIRESpur〇。所克隆的RPS7的啟動子區(qū)域的核苷酸序列 由序列表中SEQ ID NO: 1表不。
[0131] RPS7的引物組: RPS7-F: TTGATTATTGACTA£3TATTTATGTATATTAi.CAGCACATT.AACAGC RPS7-R; GCAGCAGCATGCTAGCGGCTTTCTCCTGC-GAGASCTGMGGCB.CAGCGG
[0132] 2_2)RPL32的啟動子區(qū)域的克隆 作為RPL32的啟動子區(qū)域,關于GenBank中登錄號NM_000994. 3下登記的mRNA序列, 使用從位于RPL32的轉(zhuǎn)錄起始位點的上游約2kbp的核苷酸起始,并在緊接對應RPL32的起 始密碼子序列的核苷酸序列的上游的核苷酸結(jié)束的序列。
[0133] 使用大腸桿菌人工染色體克隆RP11-767C1 (GenoTechs)作為模板擴增RPL32的啟 動子區(qū)域,并且還使用下列引物組和KOD-Plus- (Τ0Υ0Β0),并然后使用MinElute反應試劑 盒(Qiagen)純化。在CMV/pSeapIRESpuro用Spel和Nhel消化并去除CMV啟動子后,使用 In-Fusion Advantage PCR 克隆試劑盒(Clontech)在 Spel-Nhel 位點整合 RPL32 的啟動子 區(qū)域,由此構(gòu)建RPL32/pSeapIRESpur〇。所克隆的RPL32的啟動子區(qū)域的核苷酸序列由序列 表中SEQ ID N0: 2表示。
[0134] RPL32的引物組: RPL32-F: TTGATTATTGACTAGTCTAAAGTGATTCCTAAAGAATTCTTCCC P.PL32-H: GCAGCAGCATGCTAGCGATGCCTTTTGGGGAAGAAGCGGCCCC
[0135] 2-3) RPL34的啟動子區(qū)域的克隆 作為RPL34的啟動子區(qū)域,關于GenBank中登錄號NM_033625. 2下登記的mRNA序列, 使用從位于RPL34的轉(zhuǎn)錄起始位點的上游約2kbp的核苷酸起始,并在緊接對應RPL34的起 始密碼子序列的核苷酸序列的上游的核苷酸結(jié)束的序列。
[0136] 通過PCR使用大腸桿菌人工染色體克隆RP11-462C24 (GenoTechs)作為模板擴增 RPL34的啟動子區(qū)域,并且還使用下列引物組和KOD-Plus- (Τ0Υ0Β0),并然后使用MinElute 反應試劑盒(Qiagen)純化。在CMV/pSeapIRESpuro用Spel和Nhel消化并去除CMV啟動 子后,使用 In-Fusion Advantage PCR 克隆試劑盒(Clontech)在 Spel-Nhel 位點整合 RPL34 的啟動子區(qū)域,由此構(gòu)建RPL34/pSeapIRESpur〇。所克隆的RPL34的啟動子區(qū)域的核苷酸序 列由序列表中SEQ ID N0: 3表不。
[0137] RPL34的引物組: R PL3 4 -F: TTGATTATTGACTAGTATGGTGGCACAATCATGGTTCACTGCAGGC RPL34-R: GCAGCAGCATGCTAGCTCTGAGTGCCTAAATT?AGAATAGAGTAACATC
[0138] 2-4)其它人基因的啟動子區(qū)域的克隆 根據(jù)上述 2-1)中所述方法進行 EEF2、YBX1、PPIA、PSAP、RAN、PRL32、PRL34、RPLP1、 RPS7、RPS24、TMSB4X、UBC、YWHA、ARPC2和SERBP1的各自啟動子區(qū)域的克隆,由此構(gòu)建包含 克隆的多核苷酸的pSeapIRESpuro。
[0139] (實施例3)使用轉(zhuǎn)染的CH0-K1多克隆細胞中SEAP的表達水平作為指標評價啟動 子活性 3-1)轉(zhuǎn)染 CH0-K1細胞(ATCC)在5%C02中在37°C下亞培養(yǎng),使用包含10%超低IgGFBS (GIBC0) 的F-12營養(yǎng)混合物培養(yǎng)基(GIBC0)。
[0140] 以5 x 105細胞/孔將CH0-K1細胞接種到6孔培養(yǎng)板(IWAKI)上。在后一天,使 用 Lipofectamine 2000 (Invitrogen)轉(zhuǎn)染實施例 1)和 2)中構(gòu)建的 CMV/pSeapIRESpuro、 RPSVpSeapIRESpuro、RPL32/pSeapIRESpuro、RPLiM/pSeapIRESpuro 等各 2 μ g。
[0141] 3-2)使用嘌呤霉素的抗生素選擇 轉(zhuǎn)染2天后,通過胰蛋白酶處理從6孔板收集細胞,所收集的細胞的總量接種到6cm皿 (Nunc),并且以8 μ g/ml的最終濃度向培養(yǎng)基中添加噪呤霉素(Clontech)。
[0142] 3-3)使用轉(zhuǎn)染的多克隆細胞系的評價 從開始抗生素選擇開始,經(jīng)過11天,用胰蛋白酶收集轉(zhuǎn)染的多克隆細胞系,并且進行 細胞計數(shù)。然后,以1 X 1〇5細胞/孔將細胞接種到24孔培養(yǎng)板(IWAKI)上。經(jīng)過24小時,收 集培養(yǎng)物上清液,并且使用SensoLyte? pNPP分泌型堿性磷酸酶報告基因測定法(ANASPEC) 測量培養(yǎng)物上清液中SEAP的活性。在RPS7、RPL32和RPL34的各個啟動子區(qū)域的控制下 SEAP的活性高于充當對照的CMV啟動子(CMV/pSeapIRESpuro)的控制下,并且SEAP的活性 分別比對照的活性高1. 7倍或更多,2. 0倍或更多,和2. 5倍或更多(圖1)。同時,在EEF2、 YBX1、PPIA、PSAP、RAN、PRL32、PRL34、RPLP1、RPS7、RPS24、TMSB4X、UBC、YWHA、ARPC2 和 SERBP1的各個啟動子區(qū)域控制下的SEAP的活性低于CMV啟動子控制下的活性。
[0143] (實施例4)截短的啟動子的克隆 通過用作RPS7、RPL32、RPL34的截短的啟動子,從位于轉(zhuǎn)錄起始位點上游約lkb的核 苷酸開始并在緊接對應于各個基因的起始密碼子的核苷酸序列的上游結(jié)束的核苷酸序列 (T1),和從位于轉(zhuǎn)錄起始位點上游約0. 5kb的核苷酸開始并在緊接對應于各個基因的起始 密碼子的核苷酸序列的上游結(jié)束的核苷酸序列(T2),進行截短的啟動子的克隆。
[0144] 4-1) RPS7T1 和 RPS7T2 的克隆 使用在2-1)中構(gòu)建的RPS7/pSeapIRESpuro作為模板通過PCR擴增RPS7T1和RPS7T2, 并且還使用下列引物組和KOD-Plus- (Τ0Υ0Β0),并然后使用MinElute反應試劑盒(Qiagen) 純化。在CMV/pSeapIRESpuro用Spel和Nhel消化并去除CMV啟動子后,使用In-Fusion Advantage PCR克隆試劑盒(Clontech)在Spel-Nhel位點整合RPS7T1和RPS7T2各自的啟 動子區(qū)域,由此構(gòu)建 RPS7Tl/pSeapIRESpuro 和 RPS7T2/pSeapIRESpuro。所克隆的 RPS7T1 和RPS7T2的啟動子區(qū)域的核苷酸序列分別由序列表中SEQ ID N0: 4和5表示。
[0145] RPS7T1 的引物組: RPS7-T1: TTGATTATTGACTAGTCCTAGTGTGGCTTCTGCATTTTTCACAGTGC RPS7 -R; GCAGCAGCATGCTAGCGGCTTTCTCCTGtjGAGAACTGAAGGCACAGCGG RPS7T2的引物組: SPS7-T2; TTGATTATTGACTftGTCCTCGGCTCHCGGCAGCCTCGACCTTTCGGC RPS7-R; GCAGCAGCATGCTAGCGG€TTTCTCCTGGGAGA.3.CTGftAGGCACAGCGG
[0146] 4-2) RPL32T1 和 RPL32T2 的克隆 使用在2-2)中構(gòu)建的RPL32/pSeapIRESpuro作為模板通過PCR擴增RPL32T1和 RPL32T2,并且還使用下列引物組和KOD-Plus- (Τ0Υ0Β0),并然后使用MinElute反應 試劑盒(Qiagen)純化。在CMV/pSeapIRESpuro用Spel和Nhel消化并去除CMV啟動 子后,使用In-Fusion Advantage PCR克隆試劑盒(Clontech)在Spel-Nhel位點整合 RPL32T1 和 RPL32T2 各自的啟動子區(qū)域,由此構(gòu)建 RPL32Tl/pSeapIRESpuro 和 RPL32T2/ pSeapIRESpuro。所克隆的RPL32T1和RPL32T2的啟動子區(qū)域的核苷酸序列分別由序列表 中SEQ ID NO: 6和7表示。
[0147] RPL32T1 的引物組: RPL32T1: TTGATTATTGACTAGTCCTCTCGftGTAACTGGGACTACAGGCATGC RPL32-R: GCAGCAGCATGCTftGCGATGCCTTTTCGGQAAGAAGCGGCCCC RPL32T2的引物組: RPL32T2: TTGATTATTGACTAGTGCAGTTTCGCCCAGTGGTTAGAAGCGTGG RPL32-R: GCAGCftGCftTGCTAGCGATGCCTTTTGGGGAAGAAGCGGCCCG
[0148] 4-3 ) RPL34T1 和 RPL34T2 的克隆 使用在2-3)中構(gòu)建的RPL34/pSeapIRESpuro作為模板通過PCR擴增RPL34T1和 RPL34T2,并且還使用下列引物組和KOD-Plus- (Τ0Υ0Β0),并然后使用MinElute反應 試劑盒(Qiagen)純化。在CMV/pSeapIRESpuro用Spel和Nhel消化并去除CMV啟動 子后,使用In-Fusion Advantage PCR克隆試劑盒(Clontech)在Spel-Nhel位點整合 RPL34T1 和 RPL34T2 各自的啟動子區(qū)域,由此構(gòu)建 RPL34Tl/pSeapIRESpuro 和 RPL34T2/ pSeapIRESpuro。所克隆的RPL34T1和RPL34T2的啟動子區(qū)域的核苷酸序列分別由序列表 中SEQ ID N0: 8和9表示。
[0149] RPL34T1 的引物組: RPL34T1: TTGATTATTGACTAGTGCTTCCTGGAGGTGCM'TCTSAGAGCGCTCCCC RFL34-R: GChGCmCKTQCmCCrCTGAGTGCCTP^hTTMiGARThGhGThAChTC RPL34T2的引物組: RPL34T2: TTGATTATTGACTAGTGTAAAGCrTGTGCTCTGAATAAATGACAAGG RPL34-S; GCAGCAGCATGCTAGCTCTGAGTGCCTiyyiTTAAGAAmGAGTAACATC
[0150] (實施例5)使用轉(zhuǎn)染的CH0-K1多克隆細胞中SEAP的表達水平作為指標評價截短 的啟動子活性 5-1)轉(zhuǎn)染 CH0-K1細胞(ATCC)在5%C02中在37°C下亞培養(yǎng),使用包含10%超低IgGFBS (GIBC0) 的F-12營養(yǎng)混合物培養(yǎng)基(GIBC0)。
[0151] 以2x 105細胞/孔將CH0-K1細胞接種到6孔培養(yǎng)板(IWAKI)上。在后一 天,使用 Fugene 6 (Roche Applied Science)轉(zhuǎn)染實施例 1)、2)和 4)中構(gòu)建的 CMV/ pSeapIRESpuro> RPS7/pSeapIRESpuro> RPS7Tl/pSeapIRESpuro> RPS7T2/pSeapIRESpuro> RPL32/pSeapIRESpuro、RPL32Tl/pSeapIRESpuro、RPL32T2/pSeapIRESpuro、RPL34/ pSeapIRESpuro、RPL34Tl/pSeapIRESpuro 和 RPL34T2/pSeapIRESpuro 各 2 μ g。
[0152] 5-2)使用嘌呤霉素的抗生素選擇 轉(zhuǎn)染2天后,通過胰蛋白酶處理從6孔板收集細胞,并且所收集的細胞的總量接種到 6cm皿(Nunc),并且以8 μ g/ml的最終濃度向培養(yǎng)基中添加噪呤霉素(Clontech)以開始抗 生素選擇。
[0153] 5-3)使用轉(zhuǎn)染的多克隆細胞系的評價 從開始抗生素選擇開始,經(jīng)過11天,用胰蛋白酶收集每個轉(zhuǎn)染的多克隆細胞系,并且 進行細胞計數(shù)。然后,以1 X 1〇5細胞/孔將細胞接種到24孔培養(yǎng)板(IWAKI)上。經(jīng)過24 小時,收集培養(yǎng)物上清液,并且使用SensoLyte (注冊商標)pNPP分泌型堿性磷酸酶報告基 因測定法(ANASPEC)測量培養(yǎng)物上清液中SEAP的活性。測量結(jié)果顯示在圖2中。在每種 截短的啟動子的控制下SEAP的活性高于在充當對照的CMV啟動子(CMV/pSeapIRESpuro)的 控制下,并且從而,其顯示這些啟動子具有高于CMV啟動子的啟動子活性。
[0154] (實施例6) DNA元件的提取 (6-1)使用抗乙酰化的組蛋白H3抗體的染色質(zhì)免疫沉淀 根據(jù)下列方法使用EZ ChIP (Upstate)進行使用抗乙?;M蛋白抗體的ChIP。順便提 及,除非另有說明,Upstate的產(chǎn)品在下列方法中用作抗體、緩沖液等。
[0155] 首先,使用 GIBC0 (注冊商標)Freestyle? 293 培養(yǎng)基(Invitrogen)在 37°C和 8%C02的條件下培養(yǎng)293F細胞(Invitrogen),隨后離心(1000rpm,5分鐘,室溫),由此收集 生長階段的細胞。在2 X 107個細胞在包含1%甲醛的培養(yǎng)基中攪拌10分鐘后,向其中添加 l〇x甘氨酸,隨后在室溫攪拌5分鐘。離心(3000rpm,5分鐘,4°C )后,去除上清,并且向細胞 沉淀中添加 PBS以懸浮細胞。然后,再次離心細胞懸浮液以去除PBS,并且此后向細胞沉淀 添加 SDS裂解緩沖液以懸浮和裂解細胞。通過細胞裂解獲得的每種樣品使用超聲波勻漿器 (BRANSON)進行DNA片段化,同時用冰水冷卻樣品,并向其中添加包含蛋白酶抑制劑混合物 的稀釋緩沖液和固定有蛋白G的瓊脂糖。所得混合物在4°C攪拌1小時,隨后離心,并然后 收集上清液。隨后,向其中添加10 μ g正常兔IgG或α -乙酰組蛋白H3抗體,隨后在4°C 攪拌過夜。向所得溶液中添加固定有蛋白G的瓊脂糖,并且所得混合物在4°C攪拌1小時, 隨后離心,并然后收集沉淀。這樣獲得的沉淀用低鹽免疫復合物清洗緩沖液清洗兩次,用高 鹽免疫復合物清洗緩沖液清洗兩次,用LiCl免疫復合物清洗緩沖液清洗兩次,并最后用TE 緩沖液清洗4次。然后向其中添加洗脫緩沖液(包含20 μ 1 1 Μ碳酸氫鈉、10 μ 1 SDS和170 μ 1無菌水)。經(jīng)過30分鐘后,離心混合物,并且收集上清液。
[0156] 隨后,向上清液中添加5Μ氯化鈉,并且所得混合物在65°C加熱過夜。然后向其中 添加 RNA酶,并且所得混合物在37°C孵育30分鐘。然后向其中添加0. 5M EDTA、1M Tris-HCl 和蛋白酶K,并且所得混合物在45°C孵育2小時。
[0157] 最后,以比通過用蛋白酶K處理獲得的溶液高5倍的量向其中添加試劑A、B和C, 隨后使用旋轉(zhuǎn)過濾器離心(l〇〇〇〇rpm,30秒,室溫),由此純化染色質(zhì)免疫沉淀的DNA。
[0158] (6-2)微陣列分析 通過使用GenomePlex完整全基因組擴增(WGA)試劑盒(Sigma),擴增(6-1)中獲得的 每種ChIP樣品。方法根據(jù)伴隨試劑盒的Sigma的方案。
[0159] 為了證實ChIP,通過使用320ng通過WGA擴增的每種DNA作為模板,并還使用下列 引物和 SYBR (注冊商標)Premix Ex Taq? (Perfect Real Time) (TAKARA),通過 PCR 法(95°C 進行5秒和60°C進行20秒x 45個循環(huán))內(nèi)部擴增磷酸甘油醛脫氫酶(GAPDH)基因。順便 提及,GAPDH是用作陽性對照的持家基因,以證實DNA元件是否通過ChIP富集,并且PCR方 法使用EZ ChIP (Upstate)所附的引物進行。 5#-TACTAGCGGTTTXACGGGCG-3# 5r-TCGAACAGGAGGAGCAGAGAGCGA-3f
[0160] 結(jié)果證實在用抗乙?;M蛋白H3抗體進行免疫沉淀的樣品中GAPDH被特異性擴 增(圖3)。通過WGA擴增的每種DNA樣品進行微陣列分析(NimbleGen)以進行芯片上染色 質(zhì)免疫沉淀(芯片上ChIP)。"芯片上ChIP"是用于通過使在(6-1)中富集的DNA進行微陣 列分析鑒定每種DNA元件的技術。
[0161] (6_3)DNA元件的提取 基于(6-2)中獲得的芯片上ChIP分析的結(jié)果,提取了具有62%或更多的AT含量的5個 序列。
[0162] A2:染色體 I5 (8〇966429 至 8〇974878) A7:染色體 11 (88992123 至 89〇0〇542) A18:染色體 4 (111275976 至 111284450) B5:染色體 1 (143034684 至 143043084) C14:染色體 11 (46〇89〇56 至 46〇97482)。
[0163] (實施例7) 使用分泌型堿性磷酸酶(SEAP)的表達作為指標的DNA元件的效果 (7-l)SEAP表達載體的構(gòu)建 通過使用PSEAP-對照(Clontech)作為模板,通過PCR法((94°C持續(xù)30秒,和68°C持 續(xù)2分鐘X 40個循環(huán))使用下列引物和KOD -Plus- (Τ0Υ0Β0)擴增SEAP基因。 5r-AAAGCTAGCftTGCTGCTGCTGCTGCTGCTGCTGGGCC- 5r -M.?LB.GftTCTTCATGTCTGCTCGAAGCGGCCGGCCGC- 3f
[0164] 隨后,通過瓊脂糖凝膠電泳分離擴增的SEAP片段,并從凝膠上切下,然后使用 QIAquick凝膠提取試劑盒(Qiagen)純化。這樣獲得的DNA片段用作插入片段。用限制 性酶Nhel和Bglll消化插入片段,并且用限制性酶Nhel和BamHI消化載體pIRES hyg3 (Clontech)。所獲得的DNA片段進行瓊脂糖凝膠電泳以分別分離目標片段,并且將目標片 段從凝膠上切下,然后純化。然后,進行連接反應和轉(zhuǎn)化。使用LigaFastRapidDNA連接系 統(tǒng)(Promega)進行連接反應。如下進行轉(zhuǎn)化。首先融化冷凍的細胞JM109 (TAKARA),將連 接反應后獲得的10 μ 1溶液添加到融化細胞的溶液中,并將所得混合物在冰上放置30分 鐘。隨后,對混合物應用熱休克(42°C,45秒)并將混合物在冰上冷卻5分鐘。向此細胞懸 浮液中添加 lml LB培養(yǎng)基,并將所得混合物在37°C搖動1小時。然后將混合物鋪板在包含 0. 1 mg/ml氨芐青霉素的LB平板上,并將板在37°C孵育14至16小時。此后,通過堿裂解, 從LB平板上培養(yǎng)的克隆收集目標質(zhì)粒。最后,確定通過堿裂解獲得的質(zhì)粒中SEAP的多核 苷酸序列,由此構(gòu)建pCMV/SEAP ires Hygro。
[0165] (7-2 ) DNA元件的克隆 隨后,使用BAC SUBCLONING試劑盒(Gene Bridges)從包含對應插入到(7-1)中獲得的 SEAP表達載體的DNA元件的多核苷酸序列的細菌人工染色體(BAC)克隆實施例6中提取的 各個DNA元件。
[0166] 首先,用限制性酶Spel消化(7-1沖獲得的pCMV/SEAP ires Hygro幾個小時,隨后 進行乙醇沉淀,并且將沉淀物溶解在無菌水中。通過使用用Spel消化的載體作為模板,使 用下列引物和KOD -Plus- (Τ0Υ0Β0)進行PCR法(94°C持續(xù)15秒,55°C持續(xù)30秒,和68°C 持續(xù)10分鐘X 30個循環(huán))。 A2D: 5f-GGAAATTGAGAAGTATCATTCACAACAGTACCACAAACATGAAATAAATGTGGAT C€T a TTAAT AGTAATCMTTACG- 3# A2R: 5# -CTCATT€TGTGGGTTGTCATTTCACTTCCTTG?,TGCTATCCTTTCrtAGCMAATC CT AGTCAATZmTCMTGTC AACG- 3# A7D: 5f -CT.TATTTTCTiy\GTAGTAmGACTraATTGTGAGAACAAAATAJyyy\CT?GGATC CTATimTAGTAATCAATTACG- 3f A7R: 5# -CTCTTCCCATTCTCMTTG釀TCTACTTOWmGGTTTACCAmCTAAGACCTAG TCAATAATCAATGTCAACG-3* M8D: 5f -CGCCTGTAATCCCAGCACTTTGGG'AGGCTGAGGCGGGTGGATCACCTCtAGGTCGA TCCTATTAATAGTAATCAATTACG-3f A18R: 5#-CATACAGAAGCCAGTTTGAACTGAGACCTCACTCCATTTCTTACAAGTTATGCCC TAGTCAATAATCAATGTCAACG- 3r BSD: 5r-ACCGTTTTATftTTGTTTAAGCATTTCCTAGACATATTTGGCTACAAATCTAGATC CT ATTAATAGT AATCAATTIICG- 3r B5R: 5r -GMCTTAGGGGGGCTGATTAmT?AAACAATAGMATQTAGTCTTASATG.2yyiCC TAGTCAATAATCAATGTCAACG-3" C14D: 5#-CaCAAftGTTCACTGTCAAGGCCAGGTGATGAGGCCCACACATGCCCGGSCCTTGA TCCTATTiiATAGTMTCAATTACG - 3 # C14R: 5# -CAAAACCTCATCTCTACTGAAAAT/iGAAAAT'i'AGCTGGGCGTGGTGGCAGGTGCC CTAGTCAATAATCAATGTCAACG-3"
[0167] 使用部分反應溶液通過瓊脂糖凝膠電泳證實擴增之后,將剩余的反應溶液進行乙 醇沉淀。沉淀溶解在無菌水中并使用所得溶液作為用于轉(zhuǎn)化的DNA。
[0168] 隨后,進行用于轉(zhuǎn)化的大腸桿菌的制備。
[0169] 對應在實施例6中提取的5個序列的BAC克隆如下。
[0170] [表 1] 1 提取的仔列 相應的BAC*SI I-~貓撕謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝瞧mmmm顯- ................................................................................................................................ _ ................................................................ I A2 BP11-152F13 A7 RP11-643G5 | A18 ^ RP11-115A14 35 RPH-64 0M9 : ? C14 RP11-702F3 1
[0171] 已融化的10 μ 1上述BAC克?。ˋdvanced GenoTechs Co.)接種到1ml培養(yǎng)基(包 含15 μ g/ml終濃度的氯霉素)并在37°C孵育過夜。將30 μ 1培養(yǎng)溶液轉(zhuǎn)移到1. 4ml培養(yǎng) 基(包含15 μ g/ml終濃度的氯霉素)并在37°C孵育2小時。重復兩次離心和無菌水洗滌, 并將細胞懸浮到20 μ 1無菌水中。向冷卻的比色杯(0. 1 cm)中添加1 μ 1 pRED/ET (Gene Bridges)和大腸桿菌,然后進行電穿孔(1350 V,10 μ F)。然后向其中添加 lml的S0C培養(yǎng) 基,并且所得混合物在30°C孵育70分鐘。將100 μ 1培養(yǎng)溶液鋪板到LB平板上(包含終濃 度分別為3 μ g/ml和15 μ g/ml的四環(huán)素和氯霉素),并且在30°C孵育過夜。在第二天,這 樣獲得的每個克隆接種到lml培養(yǎng)基(包含終濃度分別為3 μ g/ml和15 μ g/ml的四環(huán)素 和氯霉素),并且在30°C孵育過夜。將30 μ 1培養(yǎng)溶液轉(zhuǎn)移到1. 4ml培養(yǎng)基(包含終濃度分 別為3 μ g/ml和15 μ g/ml的四環(huán)素和氯霉素),并且在30°C孵育2小時。然后向其它添加 50 μ 1 10%的L-阿拉伯糖,并進一步在37°C進行孵育1小時。此后,用無菌水洗滌重復兩 次,并且向冷卻的比色杯(〇. lcm)中添加懸浮在30 μ 1無菌水中的大腸桿菌和1 μ 1用于 轉(zhuǎn)染的DNA,然后進行電穿孔(1350 V,10 μ F)。然后向其中添加 lml的S0C培養(yǎng)基,并且所 得混合物在37°C孵育90分鐘。培養(yǎng)物溶液的總量鋪板到LB平板(包含100 μ g/ml氨芐青 霉素)上,并孵育該平板。此后通過堿裂解獲得目標質(zhì)粒。最后,證實所獲得的質(zhì)粒的序列 和其限制性酶位點,由此構(gòu)建目標質(zhì)粒(圖4)。
[0172] (7-3)使用SEAP表達作為指標的評價 使用宿主細胞 CH0-K1 (ATCC)和轉(zhuǎn)染試劑 Lipofectamine 2000(Invitrogen)評價 (7-2)中構(gòu)建的各個質(zhì)粒。
[0173] 在轉(zhuǎn)染后2天開始用800 μ g/ml的潮霉素進行抗生素選擇進行約2周,由此建立 穩(wěn)定表達的多克隆細胞系。這樣建立的細胞系在測量前一天進行培養(yǎng)基替換,并且將給定 數(shù)目的細胞接種到24孔板(IWAKI)上。在細胞鋪板24小時后,收集培養(yǎng)物上清液,并且測 量SEAP的活性。使用SensoLyte? pNPP分泌型堿性磷酸酶報告基因測定法(ANASPEC)測 量培養(yǎng)物上清液中SEAP的活性。
[0174] 測量結(jié)果顯示在圖5中。當將不具有元件的對照中SEAP的活性歸一化為1時,具 有DNA元件A2、A7、A18、B5或C14的穩(wěn)定表達的CH0細胞系的培養(yǎng)物上清液中SEAP的活 性顯示比對照的值高5倍或更多的數(shù)值。基于該結(jié)果,證實了所有5個類型的DNA元件顯 著增強SEAP表達。順便提及,上述5個類型的DNA元件的多核苷酸分別由序列表中SEQ ID NO: 10至14表示。
[0175] (實施例8)組合使用的啟動子的一般性 在實施例7中DNA元件的評價中使用的載體的啟動子是CMV啟動子,并且從而研究了 與其它一般啟動子組合的DNA元件的使用。
[0176] (8-1)使用EF-1 α和SV40啟動子的SEAP表達載體的構(gòu)建 通過使用PSEAP2-對照(Clontech)作為模板,通過PCR法((94°C持續(xù)30秒和68°C持 續(xù)2分鐘X 40個循環(huán))使用(7-1)中所述引物和KOD -Plus-擴增SEAP基因。與(7-1)中 相同的方式制備擴增的SEAP基因作為插入片段。用限制性酶Nhel和Bglll消化插入片段 并且用限制性酶Nhil和BamHI消化pIRESpuro3載體(Clontech),并且如(7-1)中相同的 方式構(gòu)建 pCMV/SEAP ires Puro。
[0177] 隨后,通過使用pEFl/V5-His A (Invitrogen)作為模板,通過PCR法(94°C持續(xù)15 秒,60°C持續(xù)30秒和68°C持續(xù)2分鐘X 30個循環(huán))使用下列引物和KOD -Plus-擴增EF-1 α 啟動子。 5f-AAAACTAGTCAGAGAGGAATCTTTGCAGCTAATGGACC-3f 51 -AAAGftTATCCCTAGCCUGCTTGGGTGGTACCAAGC-3"
[0178] 通過使用上面構(gòu)建的pCMV/SEAP ires Puro作為載體,對載體和啟動子用限制性酶 Spel和EcoRV進行消化,并且根據(jù)(7-1)中所述的方法構(gòu)建pEF/SEAP ires Puro。
[0179] 類似地,通過使用pcDNA3. 1+ (Invitrogen)作為模板,通過PCR法(94°C持續(xù)15 秒,60°C持續(xù)30秒和68°C持續(xù)1分鐘X 30個循環(huán))使用下列引物和KOD -Plus-擴增SV40 啟動子。 5r - AAAACTAG7CTGTGG?aTGTGTGTCAC;TTAGGGTG-3r 5? -A^AGM'MCAGCTTTTTGCSJyyiGCCTAGGCCT.C-Sf
[0180] 通過使用上面構(gòu)建的pCMV/SEAP ires Puro作為載體,對載體和啟動子用限制性酶 Spel和EcoRV進行消化,并且根據(jù)(7-1)中所述的方法構(gòu)建pSV40/SEAP ires Puro。
[0181] (8-2) DNA元件A2或A7的克隆 隨后,使用在(8-1)中構(gòu)建的pEF/SEAP ires Puro和pSV40/SEAP ires Puro作為基本 結(jié)構(gòu)進行DNA元件A2或A7的克隆。
[0182] 首先,用限制性酶 Spel 消化 pEF/SEAP ires Puro 和 pSV40/SEAP ires Puro 幾個小 時,隨后進行乙醇沉淀,并且將沉淀物溶解在無菌水中。通過使用用Spel消化的相應載體 作為模板,通過PCR法(94°C持續(xù)15秒,55°C持續(xù)30秒,和68°C持續(xù)10分鐘X 30個循環(huán)) 使用下列引物和KOD -Plus-制備用于轉(zhuǎn)染的DNA。 A2 (EF/D); 5# -GGAAATTGACMGmTCATTCACiACAGTACCACAAACATGAAATAAATGTGCTa GTCAGAGAGGAATCTTTGCftGC-3f ?2 {SV40/D): 5f"GGAAATTGAGAAGTATCATTCACAACAGTACCaCAAACftTGAAATAAATGTGCTa GTCTGTGGABJGTGTGTCAGTTAG-3J A2 (SF 顧 SV40/R): 5#-CTCATTCTGTGGGTTGTCATTTCACTTCCTTGATGCTATCCTTTCAAGCMyiATT TTAAAACTTTATCCATCTTTGCA-3r hi (EF/D): 5# -CTT?iTTTTCTAAGTAGTATAGACTTAATTGTGAGAi\CAAAATAAAAACTTGCTAG TCHGftGAGGAJiTCTTTGCAGC- 3" A7 {SV40/D): 5# -CTTivTT?TCT?ftAGmGTATAGACTTMTTGTGAGAACAAAATMJ4MiCTTGCTAG TCTGTGGMTGTGTGTCAGTTJIG- 3# (EF m SV40/R); 5f-CTCTTCCCATTCTCA7TTGMTCTACTTCAAAAGGTTTACCATACTAAGAACTAG TTTTAAAACTTTATCCATCTTTGCA-3r
[0183] 通過使用這樣制備的用于轉(zhuǎn)染的DNA和用pRed/ET轉(zhuǎn)染的BAC,將DNA元件A2或 A7克隆到(8-1)中所述的載體中。順便提及,根據(jù)(7-2)中所述的方法進行該方法。
[0184] (8-3)使用SEAP表達作為指標的評價 使用宿主細胞 CH0-K1 (ATCC)和轉(zhuǎn)染試劑 Lipofectamine 2000(Invitrogen)評價 (8-2)中構(gòu)建的各個質(zhì)粒。
[0185] 在轉(zhuǎn)染后2天開始用8 μ g/ml的嘌呤霉素進行抗生素選擇進行約2周,由此建立 穩(wěn)定表達的多克隆細胞系。這樣建立的細胞系在測量前一天進行培養(yǎng)基替換,并且將給定 數(shù)目的細胞接種到24孔板上。在細胞鋪板24小時后,收集培養(yǎng)物上清液,并且測量SEAP 的活性。使用SenS〇LyteTMpNPP分泌型堿性磷酸酶報告基因測定法(ANASPEC)測量培養(yǎng)物 上清液中SEAP的活性。
[0186] 測量結(jié)果顯示在圖6中。當在無元件的對照中SEAP的活性歸一化為1時,DNA元 件A2或A7展示增強表達的效果使得SEAP的活性比對照的活性在使用EF-1 α啟動子的情 況下高兩倍或更多,在使用SV40啟動子的情況下高4倍或更多?;谶@些結(jié)果,證實當與 一般啟動子組合使用時,這些DNA元件展示增強外源基因表達的效果。
[0187] (實施例9)使用抗體表達作為指標的評價 (9-1)人輕鏈表達載體pEF6KCL的構(gòu)建 通過使用質(zhì)粒pEF6/V5-HisB (Invitrogen)作為模板,通過PCR使用下列引物和K0D -Plus-獲得位置2174 (緊接BGHpA的下游)和位置2958 (Smal)之間的DNA片段(包含fl 復制起始和SV40啟動子和復制起始的DNA片段,下文稱為"片段A",片段A的多核苷酸序 列由序列表中SEQ ID N0: 15表不)。 5,-CCACGCGCCCTGTAGCGGCGCATTAAGC-3J 5r-AAACCCGGGAGCTTTTTGCftAAftGCCTAGG-3f
[0188] 通過重疊 PCR連接所獲得的片段A和包含編碼人κ鏈分泌信號、人K鏈恒定區(qū) 和人多聚(Α)附加信號的DNA序列的DNA片段(下文稱為"片段Β")。這樣獲得的其中連接 了片段Α或片段Β的DNA片段用限制性酶ΚρηΙ和Smal消化,并且將所獲得的片段連接到 質(zhì)粒pEF6/V5-HisB (Invitrogen),其用限制性酶ΚρηΙ和Smal消化,由此構(gòu)建在EF-1 α啟 動子下游具有信號序列、克隆位點、人κ鏈恒定區(qū)和人多聚(Α)附加信號序列的人輕鏈表 達載體PEF6KCL。
[0189] 將通過用限制性酶ΚρηΙ和Smal消化上述方法制備的pEF6KCL獲得的DNA片段連 接到pEFl/myc-HisB (Invitrogen)(其用ΚρηΙ和Smal消化),然后轉(zhuǎn)化,堿裂解和測序,由 此構(gòu)建質(zhì)粒pEFIKCL。
[0190] (9-2)人重鏈表達載體pEFlFCCU的構(gòu)建 包含編碼人IgGl信號序列和恒定區(qū)氨基酸序列的DNA序列的DNA片段(此DNA片段的 多核苷酸序列由序列表中SEQ ID N0: 16表示)用限制性酶Nhel和Pmel消化,并且將所得 片段連接到用Nhel和Pmel消化的質(zhì)粒pEFIKCL,由此構(gòu)建在EF-1 α啟動子的下游具有信 號序列、克隆位點、人重鏈恒定區(qū)和人多聚(Α)附加信號序列的人重鏈表達載體pEFlFCXU。
[0191] (9-3)單人源化抗體基因 X表達載體(人源化的抗體基因 X/pEF_LHN#)的構(gòu)建 通過連接(9-1)或(9-2)中構(gòu)建的L鏈或Η鏈表達載體,構(gòu)建單抗體表達載體(pEF_LHN (缺少可變區(qū)))。
[0192] 通過PCR法向基因表達單元的兩端添加限制性酶Sail位點:一個在啟動子的上 游,并且另一個在PEF1KCL的多聚(A)的下游。然后進行瓊脂糖凝膠電泳,從凝膠切出所需 的DNA片段,并且純化DNA片段,由此制備插入片段。通過用限制性酶Sail消化(9-2)中 構(gòu)建的載體PEF1FCCU,在位于所述基因表達單元上游的Sail位點線性化該載體。然后,將 線性化的載體連接到上述插入片段,然后轉(zhuǎn)化,堿裂解和測序,由此構(gòu)建單人源化抗體表達 載體(pEF_LHN (缺少可變區(qū)))。
[0193] 隨后,將下列寡核苷酸導入載體pEF_LHN (缺少可變區(qū))的Aatll位點。 5f-CGCGGCCGCACTAGTG1CGT-3? 5f-CACTftGTGCGGCCGCGACGT-3#
[0194] 將相應的寡核苷酸稀釋到5 pmol,并通過使用T4多核苷酸激酶(TAKARA),使得反 應在37°C進行1小時。然后向其添加10x Η緩沖液(TAKARA),并且通過在96°C反應1分鐘 和然后在室溫反應30分鐘進行退火。連接這些寡核苷酸和用限制性酶Aatll消化的載體 pEF_LHN,然后轉(zhuǎn)化,堿裂解和測序,由此構(gòu)建pEF_LHN# (缺少可變區(qū))。
[0195] 通過將人源化抗體基因 X的可變區(qū)整合到上面構(gòu)建的通用載體(pEF_LHN# (缺少 可變區(qū))),完成單人源化抗體基因 X表達載體(人源化抗體基因 X/pEF_LHN#)的構(gòu)建。
[0196] 首先,通過使用下列引物和KOD -Plus-,通過PCR法(94°C持續(xù)15秒,55°C持續(xù)30 秒和68°C持續(xù)1分鐘X 30個循環(huán))擴增人源化抗體基因 X的L鏈可變區(qū)。
[0197] L鏈可變區(qū): 5#-AAACATATGGCGACATCCAGATGAC-31 5 r -AJ\ACGTACGCTTGATCTCCftCCTTGG -3#
[0198] 擴增的L鏈可變區(qū)片段和通用載體(pEF_LHN# (缺少可變區(qū)))用限制性酶Ndel和 BsiWI消化,隨后進行瓊脂糖凝膠電泳,將所需片段從凝膠上切出,純化,連接反應,轉(zhuǎn)化,堿 裂解和測序,由此將所述L鏈可變區(qū)整合到載體中。以相同的方式,通過使用下列引物和 KOD -Plus-,通過PCR法(94°C持續(xù)15秒,55°C持續(xù)30秒和68°C持續(xù)1分鐘X 30個循環(huán)) 擴增人源化抗體基因 X的Η鏈可變區(qū)。
[0199] Η鏈可變區(qū): 5#-AAAGCXGAGCCAGGTGCAGCTGCAGG-3f 5r -JiAAGCTGiiGCTCA€GGTCflCCAGGGTTC-3#
[0200] 擴增的Η鏈可變區(qū)片段和其中插入L鏈可變區(qū)的載體用限制性酶BlpI消化,隨后 進行瓊脂糖凝膠電泳,將所需片段從凝膠上切出,純化,連接反應,轉(zhuǎn)化,堿裂解和測序,由 此將所述Η鏈可變區(qū)整合到載體中,并且構(gòu)建單人源化抗體基因 X表達載體(人源化抗體基 因 X/pEF_LHN#)。
[0201] (9-4)單人源化抗體基因 X表達載體(人源化的抗體基因 X/pCMV_LHN#)的構(gòu)建 通過使用(9-3)中構(gòu)建的單人源化抗體基因 X表達載體(人源化的抗體基因 X/pEF_ LHN#)作為基本載體結(jié)構(gòu),通過根據(jù)下列方法替換啟動子構(gòu)建另一個單人源化抗體基因 X 表達載體(人源化的抗體基因 X/pCMV_LHN#)。
[0202] 通過使用pIRES puro3作為模板,通過PCR法(94°C持續(xù)30秒,和68°C持續(xù)3分鐘 X 40個循環(huán))使用下列引物和KOD -Plus-擴增CMV啟動子片段。
[0203] Η鏈的上游: 5 * -CTTTTGCAiUlAAGCrrCGCGl'TACATAACTTiiCGGTAAATGGCC- 3^ 5#-TTCATGGTGGCGCTAGCCCGCAGATATCGATCCGAGCTCGGTA-L鏈的上游: 5# -TGACGTCGACAAGCT7CGCGTTftCATiy\CTTACGGTAiyW'6€CC-3# 5f -CTGGATGTCGCCATrtTGCGCCGGAGATCCACAGCAGCJiGGGAGATGAACftCCTGG GTCTGCAGCA€CATGGTGGCGCmGCCCGCAGATATCGA?CCGAGCTCGGTA-3r
[0204] 向PCR反應溶液中添加限制性酶Dpnl,并使得反應在37°C進行1小時,隨后使用 MinElute reaction Cleanup試劑盒(Qiagen)純化,由此制備用于在In-Fusion中使用的樣 品。同時,用限制性酶HindIII、NheI、NdeI和Fsel消化人源化抗體基因 X/pEF_LHN#,隨后 進行瓊脂糖凝膠電泳,由此在所得的片段中分離兩個大片段。將每個片段從凝膠上切出,并 從凝膠提取DNA,由此制備用于在In-Fusion中使用的樣品。將所有用于In-Fusion的樣 品合并,并且使用In-Fusion? Advantage PCR Cloning試劑盒(TAKARA)進行克隆,隨后進 行轉(zhuǎn)化,堿裂解和測序,由此構(gòu)建單人源化抗體基因 X表達載體(人源化抗體基因 X/pCMV_ LHN#)。
[0205] (9-5 ) DNA 元件 A7 的克隆 從已證實具有增強SEAP表達效果的5種類型的DNA元件中選擇A7,并克隆到抗體表達 載體中。
[0206] 如(7-2)中相同的方式,通過使用用限制性酶Notl消化的每種單人源化抗體基因 X表達載體(人源化抗體基因 X/pEF_LHN#和人源化抗體基因 X/pCMV_LHN#)作為模板,通過 PCR法(94°C持續(xù)15秒,55°C持續(xù)30秒和68°C持續(xù)11分鐘X 30個循環(huán))使用下列引物和 K0D -Plus-制備用于轉(zhuǎn)染的DNA。 人源化抗體基因 X/pEF_LHN# D: 5f -CTCTTCCCMTCTCAT+TTGMTCTACTTCAAAAGGTTTMXAmCTAAGACTCGA GGCACTAGTGACGTCAGGTGGCACT-3, 人源化抗體基因 X/pEF_LHN# R: 5# -CTCT?CCCOTTCTCATTTGAATCTACTTO*AASGGTTTACCATACTAHGftGCACT AGTGACGTCAGGTGGCACTTTTCGG-3 * 人源化抗體基因 X/pCMV_LHN# D: 使用人源化抗體基因 X/pEF_LHN# D。 人源化抗體基因 X/pCMV_LHN# R: 使用人源化抗體基因 X/pEF_LHN# R。
[0207] 通過使用上面制備的用于轉(zhuǎn)染的DNA和用pRed/ET轉(zhuǎn)染的BAC,將DNA元件A7克 隆到(9-3)和(9-4)中所述的單人源化抗體基因 X表達載體中。圖7中顯示了載體構(gòu)建的 示意圖。順便提及,根據(jù)(7-2)中所述的方法進行該方法。
[0208] (9-6)使用抗體表達作為指標的評價 使用宿主細胞 CH0-K1 (ATCC)和轉(zhuǎn)染試劑 Lipofectamine 2000(Invitrogen)評價 (9-5)中構(gòu)建的各個質(zhì)粒。
[0209] 在轉(zhuǎn)染后2天開始用800 μ g/ml的遺傳霉素(Roche)進行抗生素選擇進行約2 周,由此建立穩(wěn)定表達的多克隆細胞系。這樣建立的細胞系在測量前一天進行培養(yǎng)基替換, 并且將給定數(shù)目的細胞接種到24孔板上。細胞鋪板24小時后,收集培養(yǎng)上清液,通過ELISA 法測量培養(yǎng)物上清液中抗體表達水平。順便提及,如下進行ELISA。在包被50 ng/孔的抗 κ輕鏈的96孔板中,將100 μ 1無細胞培養(yǎng)物上清液加入到各孔中,并將板在37°C孵育1 小時。順便提及,去除樣品(培養(yǎng)物上清液),并且每孔用200 ylPBS-吐溫(0.05%)洗滌。 然后,向每孔中添加100 μ 1 HRP-標記的抗人IgG (Fc),并且將板在37°C孵育另外1小時。 此后,去除HRP標記的抗人IgG(Fc),并且每孔用用PBS-吐溫(0. 05%)洗滌。然后使用POD 底物ABTS試劑盒(Nacalai)顯色,并且測量在405nm的測量波長的吸收。對于抗κ輕鏈、 所述抗人IgG (Fc)和樣品的稀釋,使用PBS-吐溫(0.05%)。通過使用系列稀釋到12ng、 6ng、3ng、l. 5ng、0. 75ng、0. 375ng和0· 1875ng的人IgG作為標準品,計算樣品的濃度。
[0210] 結(jié)果顯示在圖8中。證實了當在抗體表達載體中使用EF-la啟動子或CMV啟動 子時,具有DNA元件A7的樣品相比無元件的對照具有更好的增強抗體產(chǎn)生的效果。
[0211] (實施例10)展示增強外源基因表達活性的序列的長度 (10-1)具有不同序列長度的DNA元件的克隆 基于實施例7中使用的序列的長度,構(gòu)建包含每種DNA元件但具有不同序列長度的載 體。
[0212] 基于0嫩元件4237318、85和(:14各自全長設計的具有不同序列長度的0嫩元 件的細節(jié)分別顯示在圖9、11、13、15和17中。首先,用限制性酶Spel消化(7-1)中所述 pCMV/SEAP ires Hygro幾個小時,隨后進行乙醇沉淀,并且將沉淀物溶解在無菌水中。通過 使用用Spel消化的載體作為模板,通過PCR法((94°C持續(xù)15秒,55°C持續(xù)30秒,和68°C 持續(xù)10分鐘X 30個循環(huán))使用下列引物和KOD -Plus-制備用于轉(zhuǎn)染的DNA。通過使用這 樣制備的用于轉(zhuǎn)染的DNA和相應的用pRed/ET轉(zhuǎn)染的BAC,將具有不同序列長度的每種DNA 元件克隆到(7-1)中所述的pCMV/SEAP ires Hygro中。順便提及,根據(jù)(7-2)中所述的方 法進行該方法。 A2-1D: 5f ~CATGCACAGATTAGCCMTTAGTACTTACTAAATCAA.%CTCAA?TTCTGA.%GTCT AGTTATmATAGTMTCAATTACG- 31 A2-1R: 51 -CTCATTCTGTGGGTTGTCATTTCACTTCCTTGftTGCTATCCTTTCilAGCAAAATT CftATAATCAATGTCAACGCGTATAT-3r A2-2D: 5#-ACACTGGTCAAAGGGACAGGTCATTGTTATGCTGGCAATGCAGGCTGCTGAAAAC TAGTTATTAATftGTjmTCAATTACG-3# A2-2R: 5r-ACTGTAGCTTCTTATTTTTTACCTGCAGTGCATTCCTGTAAAAGTAGTGTGGAGT CAATAATCAATGTCAACGCGTATAT-3f A2-3D; -CTGGAAATTGIiGAAGTATCATTCACAACIIGTACCACAAACATGAAATiyyiTGTGC TAGTTATTAAT AGT/SATCMiTTACG - 3# A2-3R; 5"-CCAAGCTTGTCCAACCGCGGCCTGCAGGCTGCATGCAGCCTGTGAAGGCTTTGftT CAATAATCAATGTCAACGCGTATAT-3# A2-4D: 5# -TCA/sXCATTTATCMTTTTATCTTCAAAGTCCCTCACTTCAGGGaGATGATATAC TAGTTATTAATAGTAATCAATTACG-3" A2-4R: 5r-ATATATAAAAGTTCATSTATATATAAAATCATGCAATACACGSCCTTTTGTGACT CWTAATCAATGTCAACGCGTATAT-3f A2-5D: 5,-CGCATAAAAG.SAAAAGCATCCTimjmTAAAOW:CATCAATGGCTCCTCGGTGGC mGTTATTAftTAGTAATCIlATTACG" 3f A2-5R; 使 A2-6D: 5?-GGGSGGCTACAGCTTGCCTCTCTftACCACTAAMGGCATGACCCTCCTCAAAGCT AGTTATTAATAGTAATCAATTACG-3 * A2-6R: 使用,《41 A2-7D: 5 ^ -TCTGGCTTCCCTGGGCCACGCTGGAAGAAGAATTGTTCT'TGCGCCACACATAAAAC TAGTTATTAATAGTAATCAATTACG-3, A2-7R; -AGCTGATTTTTACGTTAAATGTAACATGTAAAG.aJATATATGTGTGTTTTTAGAT CAATAATCAATGTCAACGCGTATAT-3, A2-8D: 5# -GTGAAGAGGAGGAGiYiGTCMAATTa%AAGTCTTAimTGATGTfiGTTTTAAGTAC TAGT7ATTAATA6TAATCAATTACG-3r A2-8R: -ATGACACTTC-ftTATTGTTGTTTATATTGCTGGTTAGTATGTGCCTTCATTTACCT CAATAaTCAATCTCAACGCGTATAT^- 3f A2-5D; 使 HJA2-6P? A2-9R: ttlljAlR. A2 -10 D: A2-10R; 使 WA2-71 A2-11D: 使IHA2-WL· A2-21R: 使·Α2-21 A2-12D: 使用 Λ2-2Ι), A2-12R; 使 111 .42-411- A2-13D: 使用Α2-Μ-- A2-13R; ftW.42-m- A2-KD; 使用A2D? A2-I4R; 使用A2-2H A2-15D; 使用A2-21 A2-15R: 使用A2K, A2-16D: 使用.42-βΙ A2-16R: tf 用 A2-41 A2-17D: 使謂A21 A2-17R: 使 WA2H AT-ID: 5, -AAAAACAAAACTGGAGTA/^CAAGATGA.ATTGTTTTAATAGAGGCACTGTATTAC TAGTTATTAATAGTAATCAATTACG-3 * A7-1R: 5#-ftTACAATGTTCCATGTATTCTGTGCCTGAACCTATGCAGCTGftTGTAGCTGAAGT CAATAATCAATGTCAACGCGTATAT-3f Λ7-20.· 5# -GATCTTftTTTTCTAAGTAGTATAGACTTilATTGTGAGAACAAAATAAAAACTTGC TAGTTATTAftTAGTAATCAATTACG-3 # i\7-2 R: 5r -TGTTGTTTTCAGCCACTAAGTTTGAGGTGATTTGTTCTGGCAGTCCTJIGGAAACT CAATAATC#y\TGTCAACGCGTATAT- 3# A?-3D: 使 l+f|A?-2IL· A7-3R: 5#-AGCCTACACTACCCTTTGCAGCCTTTGGTAACTATCCTTCTGCTGTCTACCTCCT CAATAATCAATGTCAACGCGTATAT-3# Α1-Α?: 5f-AGGAGCTCCTGAATGAAGGACATCACTCAGCTGTGTTAAGTATCTGGAACAATAC TAGTTATTAATAGTMTCAATTftCG-3# A7-4R: 5f -GACATJyyUiTGTAAGATATGAmTGCTfiTGTAAGAT ATGATACCTGCCTTAAAAT CAATAATCAATGTCAACGCGTATAT-3# A7-5D: 5f-CACTGCTTGATACTTACTGTGGACTTTGAAAATTATGimTGTGTGTGTGTGTGTC TAGTTATTAATAGTAATCAATTACG-3# A7-5R: 5r -CAATTACATTCCAGTG^TCTGCTACTTAGAATGCATGACTGailCTCCTGGGTGGT CAMmTCAATGTCAACGCGTATAT-3# A7-6D: 5f"TTATTTTGAAGAGAAACTCCTGGTTCCCACTTAAAATCCTTTCTTGTTTCCAAGC TAGTTAT TAATaGTAATCAATTACG-3r A7-6B: 5f"AAGCAGTGTGTGTTTaCCTGCM'GTGTATGTG/mTTAACTCTGTTCCTGAGGCftT €ftATAATCI?TGTCAACGCGTATAT-3# A7-7D; 5; -ATTGCATGTTCTCATTTMTTGTGGGATGl'JlAAAftTCAMACAATAGAACGTATC TAGTTftTTAATAGTaATCAATTACG-3# A7-7R: -TTGGGAGGCCGCAGCTGGTAGATCACTTGAGGCCACGAATTTGACACCAGCAGGT C?AT AATCJy^TGTCAACGCGTATftT - 3# A7-8D: A7-8R: 使 fi+Um A7-90; 使用A7-7D. A7-9R: 使用.47---? &7-10D; 使 f+UM-ll?, A7-10R: 使謂.47-7R, A7-11D: 使姻A7-6Da A7-I1R: 使用A7-4R? H7-12D; 使用A7-2IK A7-12R: 使 ll.lA7-iKt> A7-13D: 使用 i\7-13R; 使用A7R? A7-14D; 使|_屬" A7-14R: 使fflA7-5l A7-15D: 使用A7-6IK A7-15R: ttIljA7-7R, A7-16D: 使用A7-2D? A7-16R: 使 IIIA7-II A7-17D: 使用A7-4IK ---nR: mm Am, A1-18D: 使用Λ7-6ΙΚ A7-18R 使爾A7-51 A18-1: 5# -ATCCCCTGCTCTGCTAAmjaAGAATGGATGTTGACTCTCAGGCCCTAGtTCTTGA TCCTATTAATAGTAATCRATTACG-3 * M8-1R: MS-2D: S^-CTAAAGTGCTGGGATTACAGGCATAAGCCACCGTGCCCGGCTGGSGCATTGGGAT CCTATTAATAGTAATC AAT'T ACG- 3f JU8-2R: 5# -HCTSCTTACACATTTCGaGTTTTRimTAilGGCGTTCAATATAGAGTGaACaCCTA GTCAATAATCAATGTCftACG-31 A18-3D: -CAGGCATAAGCCACCGCACCCGGCCACCCCTTACTAATTTTTIiGTAACGTCGATC CTATTAATAGTAATCAATTACG-3f A18-3R: 卜 CTGM'TCmCTTTGMXTCTGCTTTCXAACTTI'GCCCCAAAGJmAGTmGTCACC? AGTCAATAATCAATGTCAACG-3f A18-4D: 使用 AJ8-3_h A18-4R: 5#-TTCA?4TG?AACIAGCTCTG'TGAGGCTCATTTGTACCCATTTTGTTCAGTACTGCC TilGTCASTAATCMTGTCAACG- 3r B5-1D; 5l -ACATACCCAGAGACACTGAGAGAGACAGACAGACAGTAAACAGAGGIiGCACGATC CTATTAftTAGTAATCAATTJiCG - 3r B5-1R: 使用B5R. B5-2D: -GCTCMTTGTATCTTATGAAAACAATTTTTCMiAATAiWiCAAGAGATATGATCC TSTTJ\ATftGTMTCMTTACG-3# B5-2R: 使用B5R* 35-3D: -CCTGTGCTGftATACCGfCTGCATMGTATAGGAAAGGGTTAACTCAGCAGGGAfC CTATTAATAGTAATCAATTACG-3f B5-3E: 51 -T&TGTGAATGGJyyirAimATAATCAAGCTTGTTAGAATTGTGTTCaTAATGACCC TAGTCft ATA^.TCAATGTCAACG- 3< B5-4D: ttlfjBSD, B5-4R: f/ -GA.%AGTCTACAATTTTTTCAGTTT?ViiiATGGTj%TTTATT?GTIlHCaT6Ti\CCCTA GTCAATAATCAATGTCAftCG-3r B5-5D; 使用B5-11K B5-5R: 5#-CAAAGATGAAGGATGAGAGTGACTTCTGCCTTCATTATGTTATGTGTTCATATCC mGTCAATAATCAATGTCAACG- 3, B5-6D: 5r - CftGTGAATTAT.TCACTTTGTCTTAGTTAAGTAl.AA.JiTAAAATCTGftCTGTGATCC TATTAATAGTAATCAATTACG-3r B5-6R: 5#-GAACAGACAGGTGRATGAGCACAGAGGTCATTTGTAAftCCGTTTGTGGTTAGCCT AGTCAATAATCAATC-TCAACG-3J C14-1D; 5# - CTTTTTGGCTTCTGTGTTTHAGTTATTTTTCCCCTAGGCCCA€A,%ACAGftGTCGa TCCTATTAATAGTMTCAATTACG- 3f C14-IR; 5 *-AACCTTGGAAAAATTCTGTTGTGTTTAGIAGCATGTACCAATCTATCACTCCTAG TCAATAATCAATGTCAACG-3? C14-2D: -CTATTCACTGTCTGTAGGATGAiymAGTTAATAACACCCTGftGAGGTTTCGATCC TATTAATAGTAATCaATTACG-3r C14-2R: 5,-CCTTAGATTAGTTTATTGTATTTTTTATCAGCTACTATAAGGTTTACACACCCTA GTCAATAATCAATGTCAACG-3# C14-3D; 5f -CAAGACCCTCAV4ATTCAAAAATTTCCTTTATCTTGCTGTAGCSCCTCCTGCG.HT CCTATTAATAGTAATCAATTACG-3f C14-3R; 5*-GGAGGGGHTAGGAAGGGGATGAGGCCTAACAGGTTGATGftTCTAGGCTTTACCTA GTCMTMTCMTGTC?iaCG_ 3, C14-4D: -CTCiyyyyiGGAGAT^ATTCCAGCCCCTCGCCTTAAAGAATCCCmTCftAGTGftTG CTATTAATAGTAATCAATTACG-3f C14-4R: 使朋04-11 C14-5D: 5#-CGCTTGAACCTGGGAGGCAGAGGTTGCAGTGAGCCGAGATCACGCCGTTGGATCC TATTAATAGTAATCAATTACG-3r C14-5R: 使 nicm C14-6D: 使 JUC:14-#h C14-6R; 5#-TTAACTTTTTCATCCTACAGACAGTGAATftGTAAAGCTTTCTSTGAAGACATACC CTAGTCAATAATCAATSTCAACG-3# C14-7U: 使用 C:I4-2I>,-. C14-1R: 使用Cl 4-11 C14-8D: 使爾 04-3?,. C14-8R: -AAATTATTTCCTGGTGGGCAATATTAGAiiTATGGGGAATGTTTGCTTCTGAGCCT AGTCAMAATCAATGTCAACG-3, C14-9D; C14-5R; 使用 使 WCM-3R, C14-I0D; 使用 Ι?4-2?, C14-10R: 使 IfJCMl C14-11D: 使 IOC: 1131). C14-11R: 使師0'21 C14-12D: 使用 C_4*41J? C14-12R: 使用04-il C14-13D; 使 I.HC14-3IK C14-13R: 使用 C'l'lR?v C14-14D: 使用 C'14-4l C14-14R; 便用Cl 4-21
[0213] 對于A2的相應片段的多核苷酸序列,A2-1對應序列表中SEQ ID NO: 10的核苷酸1 至3000的多核苷酸序列;A2-2對應序列表中SEQ ID NO: 10的核苷酸2801至5800的多核 苷酸序列;A2-3對應序列表中SEQ ID N0: 10的核苷酸5401至8450的多核苷酸序列;A2-4 對應序列表中SEQ ID N0: 10的核苷酸701至2700的多核苷酸序列;A2-5對應序列表中SEQ ID N0: 10的核苷酸701至2200的多核苷酸序列;A2-6對應序列表中SEQ ID N0: 10的核苷 酸701至3700的多核苷酸序列;A2-7對應序列表中SEQ ID NO: 10的核苷酸2001至5000 的多核苷酸序列;A2-8對應序列表中SEQ ID N0: 10的核苷酸4001至7000的多核苷酸序 列;A2-9對應序列表中SEQ ID N0: 10的核苷酸1至3700的多核苷酸序列;A2-10對應序 列表中SEQ ID N0: 10的核苷酸2001至5800的多核苷酸序列;A2-11對應序列表中SEQ ID NO: 10的核苷酸2801至7000的多核苷酸序列;A2-12對應序列表中SEQ ID NO: 10的核苷 酸701至5800的多核苷酸序列;A2-13對應序列表中SEQ ID NO: 10的核苷酸2001至7000 的多核苷酸序列;A2-14對應序列表中SEQ ID N0: 10的核苷酸2801至8450的多核苷酸序 列;A2-15對應序列表中SEQ ID N0: 10的核苷酸1至5800的多核苷酸序列;A2-16對應序 列表中SEQ ID N0: 10的核苷酸701至7000的多核苷酸序列;A2-17對應序列表中SEQ ID NO: 10的核苷酸2001至8450的多核苷酸序列。
[0214] 對于A7的相應片段的多核苷酸序列,A7-1對應序列表中SEQ ID N0: 11的核苷酸 601至3600的多核苷酸序列;A7-2對應序列表中SEQ ID N0: 11的核苷酸3601至8420的 多核苷酸序列;A7-3對應序列表中SEQ ID N0: 11的核苷酸5401至8420的多核苷酸序列; A7-4對應序列表中SEQ ID N0: 11的核苷酸3401至6400的多核苷酸序列;A7-5對應序列表 中SEQ ID N0: 11的核苷酸1501至4500的多核苷酸序列;A7-6對應序列表中SEQ ID N0: 11 的核苷酸4401至7400的多核苷酸序列;A7-7對應序列表中SEQ ID NO: 11的核苷酸2401 至5400的多核苷酸序列;A7-8對應序列表中SEQ ID NO: 11的核苷酸1至3600的多核苷 酸序列;A7-9對應序列表中SEQ ID N0: 11的核苷酸1501至5400的多核苷酸序列;A7-10 對應序列表中SEQ ID N0: 11的核苷酸2401至6400的多核苷酸序列;A7-11對應序列表中 SEQ ID N0: 11的核苷酸3401至7400的多核苷酸序列;A7-12對應序列表中SEQ ID N0: 11 的核苷酸4401至8420的多核苷酸序列;A7-13對應序列表中SEQ ID NO: 11的核苷酸1至 5400的多核苷酸序列;A7-14對應序列表中SEQ ID N0: 11的核苷酸1501至6400的多核苷 酸序列;A7-15對應序列表中SEQ ID N0: 11的核苷酸2401至7400的多核苷酸序列;A7-16 對應序列表中SEQ ID N0: 11的核苷酸3401至8420的多核苷酸序列;A7-17對應序列表中 SEQ ID N0: 11的核苷酸1至6400的多核苷酸序列;A7-18對應序列表中SEQ ID N0: 11的 核苷酸1501至7400的多核苷酸序列。
[0215] 對于A18的相應片段的多核苷酸序列,A18-1對應序列表中SEQ ID N0: 12的核苷 酸1至5040的多核苷酸序列;A18-2對應序列表中SEQ ID NO: 12的核苷酸1001至6002的 多核苷酸序列;A18-3對應序列表中SEQ ID N0: 12的核苷酸2001至7000的多核苷酸序列; A18-4對應序列表中SEQ ID N0: 12的核苷酸3000至7000的多核苷酸序列。
[0216] 對于B5的相應片段的多核苷酸序列,B5-1對應序列表中SEQ ID NO: 13的核苷酸 1至4001的多核苷酸序列;B5-2對應序列表中SEQ ID NO: 13的核苷酸1至3200的多核苷 酸序列;B5-3對應序列表中SEQ ID N0: 13的核苷酸2491至5601的多核苷酸序列;B5-4對 應序列表中SEQ ID N0: 13的核苷酸5373至8401的多核苷酸序列;B5-5對應序列表中SEQ ID N0: 13的核苷酸901至4001的多核苷酸序列;B5-6對應序列表中SEQ ID N0: 13的核苷 酸4001至7000的多核苷酸序列。
[0217] 對于C14的相應片段的多核苷酸序列,C14-1對應序列表中SEQ ID N0: 14的核苷 酸960至4015的多核苷酸序列;C14-2對應序列表中SEQ ID NO: 14的核苷酸1987至5014 的多核苷酸序列;C14-3對應序列表中SEQ ID N0: 14的核苷酸4020至7119的多核苷酸序 列;C14-4對應序列表中SEQ ID N0: 14的核苷酸960至8141的多核苷酸序列;C14-5對應 序列表中SEQ ID N0: 14的核苷酸960至6011的多核苷酸序列;C14-6對應序列表中SEQ ID NO: 14的核苷酸4939至8141的多核苷酸序列;C14-7對應序列表中SEQ ID NO: 14的核苷 酸960至5014的多核苷酸序列;C14-8對應序列表中SEQ ID NO: 14的核苷酸2994至7119 的多核苷酸序列;C14-9對應序列表中SEQ ID N0: 14的核苷酸4020至8141的多核苷酸序 列;C14-10對應序列表中SEQ ID N0: 14的核苷酸1至5014的多核苷酸序列;C14-11對應 序列表中SEQ ID N0: 14的核苷酸1987至7119的多核苷酸序列;C14-12對應序列表中SEQ ID N0: 14的核苷酸2994至8141的多核苷酸序列;C14-13對應序列表中SEQ ID N0: 14的 核苷酸960至7119的多核苷酸序列;C14-14對應序列表中SEQ ID NO: 14的核苷酸1987至 8141的多核苷酸序列。
[0218] 全長序列上的相應片段的起始和終止點也顯不在圖20和21中。
[0219] (10-2)具有不同序列長度的DNA元件的評價 使用宿主細胞CH0-K1 (ATCC)和轉(zhuǎn)染試劑Lipofectamine 2000評價(10-1)中構(gòu)建的 各個質(zhì)粒。
[0220] 以與(7-3)相同的方式,在轉(zhuǎn)染后用潮霉素進行抗生素選擇,由此建立穩(wěn)定表達的 多克隆細胞系。這樣建立的細胞系在測量前一天進行培養(yǎng)基替換,并且將給定數(shù)目的細胞 接種到24孔板上。在細胞鋪板24小時后,收集培養(yǎng)物上清液,并且測量SEAP的活性。
[0221] 測量結(jié)果顯示在圖10、12、14、16和18中。其證實不僅全長DNA元件,還有具有比 全長更短的序列長度的克隆都具有增強表達的效果?;诮Y(jié)果,證實DNA元件A2、A7、A18、 B5和C14具有增強外源基因表達的活性,即使在其中它們具有比全長更短的序列長度的情 況下。但是,當序列長度是全長時它們展示最高的效果。
[0222] (實施例11)使用CH0細胞系之外的宿主細胞的效果 使用CH0細胞系作為實施例7至10評價中的細胞系。但是在實施例11中,選擇HEK293 細胞系作為CH0細胞系之外的細胞系。在37°C存在5%C02的情況下將HEK293細胞系進行 靜態(tài)培養(yǎng),使用包含10%FCS的DMEM培養(yǎng)基(Invitrogen),并且在轉(zhuǎn)染前一天將給定數(shù)目的 細胞接種到6孔板上。為了評價包含(8-2)中構(gòu)建的每種DNA元件的SEAP表達載體,使用 每種質(zhì)粒和轉(zhuǎn)染試劑Lipofectamine 2000 (Invitrogen)進行轉(zhuǎn)染。在轉(zhuǎn)染后2天開始用 潮霉素進行抗生素選擇進行約2周,由此建立穩(wěn)定表達的多克隆細胞系。這樣建立的細胞 系在測量前一天進行培養(yǎng)基替換,并且將給定數(shù)目的細胞接種到24孔板上。在細胞鋪板24 小時后,收集培養(yǎng)物上清液,并且測量SEAP的活性。使用SensoLyte? pNPP分泌型堿性磷 酸酶報告基因測定法(ANASPEC)測量培養(yǎng)物上清液中SEAP的活性。
[0223] 測量結(jié)果顯示在圖19中。以與實施例3中相同的方式,證實了每種DNA元件在 HEK293細胞系中也高度有效增強外源基因(SEAP)的表達。
[0224] 工業(yè)應用性 通過使用根據(jù)本發(fā)明的啟動子或根據(jù)本發(fā)明的外源基因表達載體,將外源基因表達單 元導入哺乳動物宿主細胞,可能改善治療性蛋白、抗體等的外源基因的產(chǎn)生。 序列表 <110> DAIICHI SANKYO COMPANY, LIMITED 〈120>衍生自人基因的啟動子 <130> DSPCT-FP1232 <160> 16 〈170> Patentln 版本 3. 4 <210> 1 <211> 2348 <212> DNA 〈213>智人 <400> 1 atttatgtat attaacagca cattaacagc taaaaagaaa aactcacata atcatattag 60 ttcatagaaa caatgcattt gacatactcc aacatccatt catgatttta ttttattttg 120 tatttatata ttttttttga gatggagtct cgctgtcacc caggctggag tgcaatggct 180 cgatctcggc tcactgcagg ctccgccccc ggcggttcac gccattctcc tgcctcagcc 240 tcccgagtag ctgggactac aggcgcccgc cacctcgccc agctaatttt ttgtattttt 300 agtagagacg gggtttcacc gtgttagcca ggatggtctc gatctcctga cctcgtgatc 360 cacccgcctc ggcctcccaa agtgctggga ttacaggcgt gagccaccgt gcccggccca 420 tgattttaaa aaaacctctc agaaatagaa acagagggaa cttcctgaat ttgattaaaa 480 atacctgcaa aatcctagag ctaatattat acttaatggt gaaagactga atggttttcc 540 cctaagatgg agaacaaggc acggatgtcc ttgctcacca ctcctattca acaaaggact 600 ggaaaccaga aataacttta attttttttt ttctcaagtg ataggttcac agagaaaaag 660 ctttactgga tgaactttta gattactact tttatagagc agcagagata aaagccaggt 720 cgaaaagtgc atgtggagta aggaaatgga cctagttcga caaaagggct cagaacgact 780 gcccagatga gattgtagac gcagctgtag tttactttct atctggaaga aacttcaagt 840 tatccttaat tttccaagga gacagtcact taccttttaa aaaacattat tagagaagca 900 ccgggcggga gcatatctag cattaaaaat gtgggatgaa taccatctct gcttggtaaa 960 ggtggttggg aatcctgaga gagggcacct agtgtggctt ctgcattttt cacagtgcct 1020 ggaccacggc tgaaagtaac tcttgcatga catttgacag aagaggaaac cgaagctcag 1080 attaaattcc ctgtccacag cgggatcatt cggcacgagt tcctccctgt ctggaatgct 1140 cttccccagc aatagatcct gcggctcttc cgtgtctcag tctaatgtca ttccgttcca 1200 ggattcccga cttcttaaag cataaataat ccctccccac cctctcattg tactgttatg 1260 taacttatta caatatgtca ttatatattt agtcatactg ctttaggtaa tgtcttctcc 1320 actgaactgt aagctccatg agggcaagag ttcagtcggt tttacttaat aattagcacc 1380 tagtacagta ctagcataga atgaaggcct cgcaattttt tttaaattta tttttagaca 1440 gggtcttgcg ctgtcgccca ggctggagtg cagtggtgca acctcggctc acggcagcct 1500 cgacctttcg gctccagcga tcctcccgcg tcggcctccg gggtagctgg gactgcaggc 1560 gcgcaccacc atgactggct aatttttttt tttttttttt tgtagacatg gggtctcgcc 1620 atgttgccca ggctggttcc tgagctcaag tgatcctcct gcctcggcct cccaaagtgc 1680 tgggattaca ggcgtgagcc tcagcgccca gccaagttag ccttttttaa acgtcctgtc 1740 tccggaggtt gccgaagttg gttttcttcg gcctccttct ctctcccagg cccagggctg 1800 ggacgaggcc ggttcccgcc tgcaacctgc actgaagacg ggaaccttgg gagccggtac 1860 cggaacgctc ggaaacggca ccaaagtacg aatcctaggg cggaaaagcg ttaccaagac 1920 actcgtcccc agagccgctt cctgggactc tctagcctcc taccgcttct cagtgatgtt 1980 ccggtttccg ccctcctcct cgcgctgttt ccgcctcttg ccttcggacg ccggattttg 2040 acgtgctctc gcgagatttg ggtctcttcc taagccggcg ctcggcaagg taggttggcg 2100 gcctgctctc cgacagaact tttcttcttg ggttgaggaa aacgcctttt ggagtcaggc 2160 cctggagggg cgagccttgc tcacagggtg gggatacagc cgattacccg ccctgtgctt 2220 tccgatggct tctgcggggc gagcggggcc tggccggggg gtgcgggcgg gagggcgagc 2280 cagcggcgcc tgcagcccgg gccgcgtaac gctgaccgct gtgccttcag ttctcccagg 2340 agaaagcc 2348 〈210〉 2 〈211〉 3345 〈212〉 DNA 〈213〉智人 〈400〉 2 ctaaagtgat tcctaaagaa ttcttccctt ttatcacttc cagtaggcct ctgtgaaacc 60 aaatctacct ccgcttacaa gaaagatgct gggctggcct tctctcaaag tctttccaaa 120 cttttcttgg cattgactta gacaccctag gaatctaact tgagaaaatg ttttcattaa 180 aaaaaatctc aggaagtaaa acctcctgaa tgattactga gttgacataa atcttatgtg 240 tatattctta tcagaaaaaa agtatcttca ttttgtggga caccaattca tgtattatta 300 ttattttgag acaaagtttc gctcttgttg cccaggctgg agtgcaatgg cgcgatctcc 360 acttactgca acctccacct cctgagttca agtgattctc gtgcctcagc ctccctagta 420 gctggaacta caggcatgtg ccaccacacc cagctaattt tttgtaactt tagtagagat 480 ggggtttcac catgttggcc aggatggact cgaactcctg accacaggtg atctgcccac 540 ctcagcttcc caaagtgctg ggattacagg catgagccac cgcgcccagt cgctgggtct 600 tacagtaact ttatgtttaa cattttgagg aaatgctatt cttttccaaa gtgactgcac 660 catttcatat ttgcactagc actgtacgga cattcccatt tctctgtcct agtgagtgtg 720 aaatggtatc tcactgcagt tccagtttgt atttccctga tggctaatga tgtggatcat 780 ttcatgtgtt cattggccac agagaaatgt ctatttggat tctttaccca tttttcaatt 840 gggttatttg tctttatagg tttgttgttg ttgagacaga gtcttgctct gtcactcagg 900 ctggagtgca gtggcattat cacagctaac tgcagtctag aactgctggg ctcacgtgat 960 catcccagct cagcctctcg agtaactggg actacaggca tgcgccacca gccccagcta 1020 attattttat tttttgtaga gacagggtct tactatgttg cctaggccgg tcttgaactc 1080 ctgggctcaa gcaaatctcc cacctcagac tcccaaagta ttggaattat aggtgtgaac 1140 catagtgctc agccaatttg cacaataatc ttaaatacaa aagctaagca aaacaaatca 1200 agagcatctt taaaaactag gcagtctggg aggcaggggc tgccgtgagc cgtgagatgg 1260 cacctttgca ttccagccta ggtgacagag ggaggccctg tctaaaaaaa accaaaaacc 1320 aaaaaacaaa acaaaacaaa aaacatctag gcagtagctc gtgcccgtaa tcccagctac 1380 tcaggaggct gaggcgagag aatcgtttga gcccaggagt tcaagaccag cctgggcaac 1440 agagtgagac cccatttcta aaaaatgaac aaagaaaaac taggcagttt cgcccagtgg 1500 ttagaagcgt ggagtttgga gtcaagtctc caaatttcat cttccacata tgcaaaatgg 1560 agacaataat aggggtacgt tatagaattg tggtaggcat agtgaactcc atcgcatgtt 1620 agctgttttc gttactattt actgtctaaa ttcggtgatg aaattattag gaagtctctg 1680 tcttgttctc ttctgaccac taagaggcgc acttcggagt agaagaaacg cgggcggaaa 1740 tagcccaaaa gcggattggc ttcgacttct ggcggaagta aattcctccc tccaccaggt 1800 cttattagct cagaaagaat tccaaatttc tacgtagtcc caaggatagg tagaatacat 1860 ttctcagtcc tattcctagt tattattgtc tattaaaaca tgtatactca gaatttttgc 1920 ggcattattt tttgacgtgt ctttatttta tttaaaagag ccggagccgg aagtgcttgc 1980 ctttttccct gctaggaccc aggggttacg acccatcagc ccttgcgcgc caccgtccct 2040 tctctcttcc tcggcgctgc ctacggaggt ggcagccatc tccttctcgg taagtgttaa 2100 tccgtggcaa tccgcattcc tgcgggattc atctggcccc gtcgcccagt ggtgcggagg 2160 cctccccttc agcgcggtag tgtctgtggg tattgttatt gtcagcttac tggagcgtgt 2220 acaggaacag aacgaagccg ccgagttgat agggctttgc gtcccagagc ctcctgccct 2280 ccgcctgtat tcagagctgc gggctgcttg tttgttcctt ggcggtggag ggtgctagtt 2340 gaggccagac ttcggggtct cctgggggcc gtgggacgac caggggtggc ccagcttgac 2400 agctttcagc tgggatctgt ggatcccagc gctcaccaat gtcggcccac gtgtattcgt 2460 tcatgccatg gccggcttct tccgctgcag tctctggccc gagggctgct gctgcgggac 2520 cgccaaggaa agacgagctg taggtcggct ggtccagctg caggcagaaa ttctggtagt 2580 atctctggga atatgaagat gcaactgccc ccaccttgcc ttcgaggata tcatgggcca 2640 gaaggcagag tcgttttgaa tacgtggttc attgagtacc cactctgggc cagttgatgg 2700 ctgcgaagag agcagaaggg gtgctgctgt aggaaatcaa tggctcggaa gaccacactg 2760 aggaaggtgt gagttgatac tggaagatct ccaggtttga ggcatcttca gaggtatatg 2820 gtggttttgt gtgtgttgag ggtgtggtag cgcagcagct ccctagggaa ttagaaggtt 2880 ttattgaaca tttaccctgt gacaggcact gcaggcattc agcgcgcagt gtcatcttca 2940 ttttacaggt gaggaaaaga ctcaggttca agtagatggt caaggccagt actaccggaa 3000 ggaccatctg ggggttcgga cactggtggg gtgggatttg ctgccccttg caaattgaga 3060 gtgtcttggg gtcagttttg atttgctcag ctgttggcat tctttgggct ctgagtgggt 3120 gaggtgaccc ttgacctcct gggatcgcat ctggagagtg cctagtattc tgccagcttc 3180 ggaaagggag ggaaagcaag cctggcagag gcacccattc cattcccagc ttgctccgta 3240 gctggcgatt ggaagacact ctgcgacagt gttcagtccc tgggcaggaa agcctccttc 3300 caggattctt cctcacctgg ggccgcttct tccccaaaag gcatc 3345 〈210〉 3 〈211〉 3337 〈212〉 DNA 〈213〉智人 〈400〉 3 atggtggcac aatcatggtt cactgcagcc tcaaacttct aggctcaagt gatcctccag 60 cctcagcctc ctgagtaggt gggactaaag gtgtgtgcta caacacctgg ctaattaaaa 120 aaaaaaaatt tgtagagatg ggcgtctcgc tatgttgccc aggctgatct ttaactacag 180 gtctcagtga tctttctgta tcagcctccc gaagtgctag gattaacagg catgggccac 240 tgtacctggc tgtctttgaa gtttttaata agattgccat atctctctca agactgatca 300 agaaaaaatg caaatacaaa tttaaagaga gggaaaaata gtattatgga actgggttaa 360 gtaccttaag ggaaaactac aacaatgaga ccactattct tatctacttg ggtgggggaa 420 ggcacggaca gagacgtaaa caacagcata gtgtgccaag ggctcccatc tcctgttctc 480 ttctgctctg caaagtctct cttaaaatat agagaacata ttgcaagtaa atacattcat 540 tagtgcattt attcaaaaac cacatttgtc tctctatgca agcttccatc tcaatgcctg 600 gcacagagac gaaaaggatt tcagaggaca aaaatcaaag gactggaaag gagggaagta 660 gctgatgaca aggtcggggg agaagcagct atttgagagt gagcagaggg aaggatataa 720 ccagagcctt ccatctggtg ttgtgacaaa gatggcagtg atgtgaggct tgatagaatc 780 aataggcctc acagttcaag acagactaca tgccctcagt cacttgcctg ctttcttggt 840 ttgctagatg gattagaaat actagaagga aagttgagtg ggtactggga tatcctatcc 900 aaatcctctc ttctggggca atgcagctgc ctcacagcaa ccacgttgtg gatcacctga 960 ccccgccttt ctcagcttcc tggaggtgca ttctaagagc gctccccata agccaacact 1020 caagtctctt cgaggtgtgt ttccagggag cctgatctaa gattaaaaac ttaaaggccc 1080 cttttagaat tgtcttttac agcccaggca aagagttctt tactttttta gaggtcatga 1140 atccctttga caaggtgatg aaagccaggg accctcttct cagaaaaata cacacgtgcg 1200 cttaatgtaa aattttacat actgttttaa aggttaaact ttaccaccca tgaaaagcct 1260 caagtagttc tttgtacata atcataagat tagcaaccat ttactgagca cttcctctct 1320 ataagaccct gtgctaagtg ctttaacttc ataatgcctt tgatcatgac ataacatggc 1380 acggtagttc ctaatatctt ccttttagag atttaagggc ttgctcaaag taacatagct 1440 aataattagc agacactgga ttaaaatccc aatttgtttg taaagcttgt gctctgaata 1500 aatgacaagg aaagagaagg gaaggttgaa gaagggaagg ttcttgaagg tccctggtcc 1560 ttgaaggtcc cttaaccata aatgtcaaga gttgggattt aaacccaggt ctaacgccag 1620 agctggcgcc ctttagatta aaagtgcagt gtccatgaca acgaaagaag ttgattttgt 1680 cccacctttg ctctttgcgg cttttcattt gcgtttgttt ccacagcgat ttccaataga 1740 tttctgcgtg gccttgacac agacagctag tgtgaatccc cgcccacaga ggggcggcac 1800 gttggttgcc gtacaacgtg gtggttccct gcatctctgc ccacgtcgga gaggtgcgtc 1860 ggcttccgta caacacggat actctctctc tgacgcaact tcctgtcctg cgcaattcta 1920 tttgaccttt gaactggcaa aggctttttt cttcctcttc cggggacgtt gtctgcaggt 1980 atggatgttg ttctcttttc cctgtcttta tttccttacc aatcggctgc catccgagga 2040 gctgaggaag cctagagctc tcagaagcag tcctttgagc tggtgtaggg gtaaggggca 2100 caacagggag gttggtggtg aggaagttcc ttactttgat ctttggaaat cccttgttcc 2160 tggtggcacc tccaaagccg tgagtagcca cagctcacca cccgggactt tgctgcattc 2220 caagtgtagc gtttggagac taacgagttg tggtttggcg gtttgagtct ggaaaatcgc 2280 caaacgtttt catattttac acccacgttt tcacagcacg cctgtacgtg tccttagtct 2340 ttgggagggc agggtccggc gagttcgggt ggtttcgcta tttggcttct gcgtccaagg 2400 cccatgtcaa ggaagagaaa aatgtgttag aagtttctgt cttgcttttg gagatgcaaa 2460 cagaataatg gcttcataaa tcactcgcac tggttttacg tgtcaagttt tggtgtctgg 2520 taattctgtt ttagtttaat tttagtgaga ggcttgtgac aacaaatgag gtggttacaa 2580 ggggtggaat gggaagatta aattagttca agtattgatt atgttttacg ttgggtagtt 2640 cccttaacga agttgctcgt atgcatatct gtataaccga tttgctaaat aacatcacga 2700 tgtttccaga agtgggaaga aagcaggtgc cataacccaa agaaacttgt gtaatatcaa 2760 aattagtatt aaagggtatg cctttacgca ggtggtgctt tagggcaaga cattgaaccc 2820 tgatatgtgc caggcattgt gttgggacgg atagcccacg tcgtttaatc ctaatgacag 2880 ctgtataaag tagacagaat tcccatgtta gagataagga ggctagctcc ttgcccttta 2940 tattcccagt aaatggcata gctaaggatt cgacttcaga gctcactttt tgtgctcttt 3000 gtttaaagcg gtgtttctcc aactgggctc gtggcacttt tctggacacc actccaaaca 3060 aaattagact ctgagtaagg agcctggtca tcagaacgtt aaggaagtgc cacgtttgat 3120 taccatcagg aaagctaaca ttcttggcct cttgtttatc agtcaccttt aaatacaagt 3180 agttttaaaa tgtggaataa tacatcttaa tttaagggtg ttacatacaa ggatatgtat 3240 gtgaatgaaa tagaccacat gatactgttt tgagatttta tttactttta caatggaaag 3300 atttgatgtt actctattct taatttaggc actcaga 3337 〈210〉 4 〈211〉 1361 〈212〉 DNA 〈213〉智人 〈400〉 4 cctagtgtgg cttctgcatt tttcacagtg cctggaccac ggctgaaagt aactcttgca 60 tgacatttga cagaagagga aaccgaagct cagattaaat tccctgtcca cagcgggatc 120 attcggcacg agttcctccc tgtctggaat gctcttcccc agcaatagat cctgcggctc 180 ttccgtgtct cagtctaatg tcattccgtt ccaggattcc cgacttctta aagcataaat 240 aatccctccc caccctctca ttgtactgtt atgtaactta ttacaatatg tcattatata 300 tttagtcata ctgctttagg taatgtcttc tccactgaac tgtaagctcc atgagggcaa 360 gagttcagtc ggttttactt aataattagc acctagtaca gtactagcat agaatgaagg 420 cctcgcaatt ttttttaaat ttatttttag acagggtctt gcgctgtcgc ccaggctgga 480 gtgcagtggt gcaacctcgg ctcacggcag cctcgacctt tcggctccag cgatcctccc 540 gcgtcggcct ccggggtagc tgggactgca ggcgcgcacc accatgactg gctaattttt 600 tttttttttt ttttgtagac atggggtctc gccatgttgc ccaggctggt tcctgagctc 660 aagtgatcct cctgcctcgg cctcccaaag tgctgggatt acaggcgtga gcctcagcgc 720 ccagccaagt tagccttttt taaacgtcct gtctccggag gttgccgaag ttggttttct 780 tcggcctcct tctctctccc aggcccaggg ctgggacgag gccggttccc gcctgcaacc 840 tgcactgaag acgggaacct tgggagccgg taccggaacg ctcggaaacg gcaccaaagt 900 acgaatccta gggcggaaaa gcgttaccaa gacactcgtc cccagagccg cttcctggga 960 ctctctagcc tcctaccgct tctcagtgat gttccggttt ccgccctcct cctcgcgctg 1020 tttccgcctc ttgccttcgg acgccggatt ttgacgtgct ctcgcgagat ttgggtctct 1080 tcctaagccg gcgctcggca aggtaggttg gcggcctgct ctccgacaga acttttcttc 1140 ttgggttgag gaaaacgcct tttggagtca ggccctggag gggcgagcct tgctcacagg 1200 gtggggatac agccgattac ccgccctgtg ctttccgatg gcttctgcgg ggcgagcggg 1260 gcctggccgg ggggtgcggg cgggagggcg agccagcggc gcctgcagcc cgggccgcgt 1320 aacgctgacc gctgtgcctt cagttctccc aggagaaagc c 1361 <210> 5 〈211> 867 <212> DNA 〈213>智人 〈400> 5 cctcggctca cggcagcctc gacctttcgg ctccagcgat cctcccgcgt cggcctccgg 60 ggtagctggg actgcaggcg cgcaccacca tgactggcta attttttttt tttttttttt 120 gtagacatgg ggtctcgcca tgttgcccag gctggttcct gagctcaagt gatcctcctg 180 cctcggcctc ccaaagtgct gggattacag gcgtgagcct cagcgcccag ccaagttagc 240 cttttttaaa cgtcctgtct ccggaggttg ccgaagttgg ttttcttcgg cctccttctc 300 tctcccaggc ccagggctgg gacgaggccg gttcccgcct gcaacctgca ctgaagacgg 360 gaaccttggg agccggtacc ggaacgctcg gaaacggcac caaagtacga atcctagggc 420 ggaaaagcgt taccaagaca ctcgtcccca gagccgcttc ctgggactct ctagcctcct 480 accgcttctc agtgatgttc cggtttccgc cctcctcctc gcgctgtttc cgcctcttgc 540 cttcggacgc cggattttga cgtgctctcg cgagatttgg gtctcttcct aagccggcgc 600 tcggcaaggt aggttggcgg cctgctctcc gacagaactt ttcttcttgg gttgaggaaa 660 acgccttttg gagtcaggcc ctggaggggc gagccttgct cacagggtgg ggatacagcc 720 gattacccgc cctgtgcttt ccgatggctt ctgcggggcg agcggggcct ggccgggggg 780 tgcgggcggg agggcgagcc agcggcgcct gcagcccggg ccgcgtaacg ctgaccgctg 840 tgccttcagt tctcccagga gaaagcc 867 〈210〉 6 <211> 2372 〈212> DNA 〈213>智人 〈400> 6 cctctcgagt aactgggact acaggcatgc gccaccagcc ccagctaatt attttatttt 60 ttgtagagac agggtcttac tatgttgcct aggccggtct tgaactcctg ggctcaagca 120 aatctcccac ctcagactcc caaagtattg gaattatagg tgtgaaccat agtgctcagc 180 caatttgcac aataatctta aatacaaaag ctaagcaaaa caaatcaaga gcatctttaa 240 aaactaggca gtctgggagg caggggctgc cgtgagccgt gagatggcac ctttgcattc 300 cagcctaggt gacagaggga ggccctgtct aaaaaaaacc aaaaaccaaa aaacaaaaca 360 aaacaaaaaa catctaggca gtagctcgtg cccgtaatcc cagctactca ggaggctgag 420 gcgagagaat cgtttgagcc caggagttca agaccagcct gggcaacaga gtgagacccc 480 atttctaaaa aatgaacaaa gaaaaactag gcagtttcgc ccagtggtta gaagcgtgga 540 gtttggagtc aagtctccaa atttcatctt ccacatatgc aaaatggaga caataatagg 600 ggtacgttat agaattgtgg taggcatagt gaactccatc gcatgttagc tgttttcgtt 660 actatttact gtctaaattc ggtgatgaaa ttattaggaa gtctctgtct tgttctcttc 720 tgaccactaa gaggcgcact tcggagtaga agaaacgcgg gcggaaatag cccaaaagcg 780 gattggcttc gacttctggc ggaagtaaat tcctccctcc accaggtctt attagctcag 840 aaagaattcc aaatttctac gtagtcccaa ggataggtag aatacatttc tcagtcctat 900 tcctagttat tattgtctat taaaacatgt atactcagaa tttttgcggc attatttttt 960 gacgtgtctt tattttattt aaaagagccg gagccggaag tgcttgcctt tttccctgct 1020 aggacccagg ggttacgacc catcagccct tgcgcgccac cgtcccttct ctcttcctcg 1080 gcgctgccta cggaggtggc agccatctcc ttctcggtaa gtgttaatcc gtggcaatcc 1140 gcattcctgc gggatteatc tggccccgtc gcccagtggt gcggaggcct ccccttcage 1200 gcggtagtgt ctgtgggtat tgttattgtc agcttactgg agcgtgtaca ggaacagaac 1260 gaagccgccg agttgatagg gctttgcgtc ccagagcctc ctgccctccg cctgtattca 1320 gagctgcggg ctgcttgttt gttccttggc ggtggagggt getagttgag gccagacttc 1380 ggggtctcct gggggccgtg ggacgaccag gggtggccca gcttgacagc tttcagctgg 1440 gatctgtgga tcccagcgct caccaatgtc ggcccacgtg tattegttea tgccatggcc 1500 ggcttcttcc getgeagtet ctggcccgag ggctgctgct gcgggaccgc caaggaaaga 1560 cgagctgtag gtcggctggt ccagctgcag gcagaaattc tggtagtatc tctgggaata 1620 tgaagatgea actgccccca ccttgccttc gaggatatca tgggccagaa ggeagagteg 1680 ttttgaatac gtggttcatt gagtacccac tctgggccag ttgatggctg egaagagage 1740 agaaggggtg ctgctgtagg aaatcaatgg ctcggaagac cacactgagg aaggtgtgag 1800 ttgatactgg aagatctcca ggtttgaggc atcttcagag gtatatggtg gttttgtgtg 1860 tgttgagggt gtggtagcgc agcagctccc tagggaatta gaaggtttta ttgaacattt 1920 accctgtgac aggcactgca ggcattcagc gcgcagtgtc atcttcattt tacaggtgag 1980 gaaaagactc aggttcaagt agatggtcaa ggccagtact accggaagga ccatctgggg 2040 gttcggacac tggtggggtg ggatttgctg ccccttgcaa attgagagtg tcttggggtc 2100 agttttgatt tgctcagctg ttggcattct ttgggctctg agtgggtgag gtgacccttg 2160 acctcctggg atcgcatctg gagagtgcct agtattctgc cagcttcgga aagggaggga 2220 aagcaagcct ggcagaggca cccattccat tcccagcttg ctccgtagct ggcgattgga 2280 agacactctg cgacagtgtt cagtccctgg gcaggaaagc ctccttccag gattcttcct 2340 cacctggggc cgcttcttcc ccaaaaggca tc 2372 〈210〉 7 〈211〉 1862 〈212〉 DNA 〈213〉智人 〈400〉 7 gcagtttcgc ccagtggtta gaagcgtgga gtttggagtc aagtctccaa atttcatctt 60 ccacatatgc aaaatggaga caataatagg ggtacgttat agaattgtgg taggcatagt 120 gaactccatc gcatgttagc tgttttcgtt actatttact gtctaaattc ggtgatgaaa 180 ttattaggaa gtctctgtct tgttctcttc tgaccactaa gaggcgcact tcggagtaga 240 agaaacgcgg gcggaaatag cccaaaagcg gattggcttc gacttctggc ggaagtaaat 300 tcctccctcc accaggtctt attagctcag aaagaattcc aaatttctac gtagtcccaa 360 ggataggtag aatacatttc tcagtcctat tcctagttat tattgtctat taaaacatgt 420 atactcagaa tttttgcggc attatttttt gacgtgtctt tattttattt aaaagagccg 480 gagccggaag tgcttgcctt tttccctgct aggacccagg ggttacgacc catcagccct 540 tgcgcgccac cgtcccttct ctcttcctcg gcgctgccta cggaggtggc agccatctcc 600 ttctcggtaa gtgttaatcc gtggcaatcc gcattcctgc gggattcatc tggccccgtc 660 gcccagtggt gcggaggcct ccccttcage gcggtagtgt ctgtgggtat tgttattgtc 720 agcttactgg agcgtgtaca ggaacagaac gaagccgccg agttgatagg gctttgcgtc 780 ccagagcctc ctgccctccg cctgtattca gagctgcggg ctgcttgttt gttccttggc 840 ggtggagggt gctagttgag gccagacttc ggggtctcct gggggccgtg ggacgaccag 900 gggtggccca gcttgacagc tttcagctgg gatctgtgga tcccagcgct caccaatgtc 960 ggcccacgtg tattcgttca tgccatggcc ggcttcttcc gctgcagtct ctggcccgag 1020 ggctgctgct gcgggaccgc caaggaaaga cgagctgtag gtcggctggt ccagctgcag 1080 gcagaaattc tggtagtatc tctgggaata tgaagatgca actgccccca ccttgccttc 1140 gaggatatca tgggccagaa ggcagagtcg ttttgaatac gtggttcatt gagtacccac 1200 tctgggccag ttgatggctg cgaagagagc agaaggggtg ctgctgtagg aaatcaatgg 1260 ctcggaagac cacactgagg aaggtgtgag ttgatactgg aagatctcca ggtttgaggc 1320 atcttcagag gtatatggtg gttttgtgtg tgttgagggt gtggtagcgc agcagctccc 1380 tagggaatta gaaggtttta ttgaacattt accctgtgac aggcactgca ggcattcagc 1440 gcgcagtgtc atcttcattt tacaggtgag gaaaagactc aggttcaagt agatggtcaa 1500 ggccagtact accggaagga ccatctgggg gttcggacac tggtggggtg ggatttgctg 1560 ccccttgcaa attgagagtg tcttggggtc agttttgatt tgctcagctg ttggcattct 1620 ttgggctctg agtgggtgag gtgacccttg acctcctggg atcgcatctg gagagtgcct 1680 agtattctgc cagcttcgga aagggaggga aagcaagcct ggcagaggca cccattccat 1740 tcccagcttg ctccgtagct ggcgattgga agacactctg cgacagtgtt cagtccctgg 1800 gcaggaaagc ctccttccag gattcttcct cacctggggc cgcttcttcc ccaaaaggca 1860 tc 1862 <210> 8 <211> 2363 <212> DNA 〈213>智人 〈400> 8 gcttcctgga ggtgcattct aagagcgctc cccataagcc aacactcaag tctcttcgag 60 gtgtgtttcc agggagcctg atctaagatt aaaaacttaa aggccccttt tagaattgtc 120 ttttacagcc caggcaaaga gttctttact tttttagagg tcatgaatcc ctttgacaag 180 gtgatgaaag ccagggaccc tcttctcaga aaaatacaca cgtgcgctta atgtaaaatt 240 ttacatactg ttttaaaggt taaactttac cacccatgaa aagcctcaag tagttctttg 300 tacataatca taagattagc aaccatttac tgagcacttc ctctctataa gaccctgtgc 360 taagtgcttt aacttcataa tgcctttgat catgacataa catggcacgg tagttcctaa 420 tatcttcctt ttagagattt aagggcttgc tcaaagtaac atagctaata attagcagac 480 actggattaa aatcccaatt tgtttgtaaa gcttgtgctc tgaataaatg acaaggaaag 540 agaagggaag gttgaagaag ggaaggttct tgaaggtccc tggtccttga aggtccctta 600 accataaatg tcaagagttg ggatttaaac ccaggtctaa cgccagagct ggcgcccttt 660 agattaaaag tgcagtgtcc atgacaacga aagaagttga ttttgtccca cctttgctct 720 ttgcggcttt tcatttgcgt ttgtttccac agcgatttcc aatagatttc tgcgtggcct 780 tgacacagac agctagtgtg aatccccgcc cacagagggg cggcacgttg gttgccgtac 840 aacgtggtgg ttccctgcat ctctgcccac gtcggagagg tgcgtcggct tccgtacaac 900 acggatactc tctctctgac gcaacttcct gtcctgcgca attctatttg acctttgaac 960 tggcaaaggc ttttttcttc ctcttccggg gacgttgtct gcaggtatgg atgttgttct 1020 cttttccctg tctttatttc cttaccaatc ggctgccatc cgaggagctg aggaagccta 1080 gagctctcag aagcagtcct ttgagctggt gtaggggtaa ggggcacaac agggaggttg 1140 gtggtgagga agttccttac tttgatcttt ggaaatccct tgttcctggt ggcacctcca 1200 aagccgtgag tagccacagc tcaccacccg ggactttgct gcattccaag tgtagcgttt 1260 ggagactaac gagttgtggt ttggcggttt gagtctggaa aatcgccaaa cgttttcata 1320 ttttacaccc acgttttcac agcacgcctg tacgtgtcct tagtctttgg gagggcaggg 1380 tccggcgagt tcgggtggtt tcgctatttg gcttctgcgt ccaaggccca tgtcaaggaa 1440 gagaaaaatg tgttagaagt ttctgtcttg cttttggaga tgcaaacaga ataatggctt 1500 cataaatcac tcgcactggt tttacgtgtc aagttttggt gtctggtaat tctgttttag 1560 tttaatttta gtgagaggct tgtgacaaca aatgaggtgg ttacaagggg tggaatggga 1620 agattaaatt agttcaagta ttgattatgt tttacgttgg gtagttccct taacgaagtt 1680 gctcgtatgc atatctgtat aaccgatttg ctaaataaca tcacgatgtt tccagaagtg 1740 ggaagaaagc aggtgccata acccaaagaa acttgtgtaa tatcaaaatt agtattaaag 1800 ggtatgcctt tacgcaggtg gtgctttagg gcaagacatt gaaccctgat atgtgccagg 1860 cattgtgttg ggacggatag cccacgtcgt ttaatcctaa tgacagctgt ataaagtaga 1920 cagaattccc atgttagaga taaggaggct agctccttgc cctttatatt cccagtaaat 1980 ggcatagcta aggattcgac ttcagagctc actttttgtg ctctttgttt aaagcggtgt 2040 ttctccaact gggctcgtgg cacttttctg gacaccactc caaacaaaat tagactctga 2100 gtaaggagcc tggtcatcag aacgttaagg aagtgccacg tttgattacc atcaggaaag 2160 ctaacattct tggcctcttg tttatcagtc acctttaaat acaagtagtt ttaaaatgtg 2220 gaataataca tcttaattta agggtgttac atacaaggat atgtatgtga atgaaataga 2280 ccacatgata ctgttttgag attttattta cttttacaat ggaaagattt gatgttactc 2340 tattcttaat ttaggcactc aga 2363 〈210〉 9 〈211〉 1858 〈212〉 DNA 〈213〉智人 〈400〉 9 gtaaagcttg tgctctgaat aaatgacaag gaaagagaag ggaaggttga agaagggaag 60 gttcttgaag gtccctggtc cttgaaggtc ccttaaccat aaatgtcaag agttgggatt 120 taaacccagg tctaacgcca gagctggcgc cctttagatt aaaagtgcag tgtccatgac 180 aacgaaagaa gttgattttg tcccaccttt gctctttgcg gcttttcatt tgcgtttgtt 240 tccacagcga tttccaatag atttctgcgt ggccttgaca cagacagcta gtgtgaatcc 300 ccgcccacag aggggcggca cgttggttgc cgtacaacgt ggtggttccc tgcatctctg 360 cccacgtcgg agaggtgcgt cggcttccgt acaacacgga tactctctct ctgacgcaac 420 ttcctgtcct gcgcaattct atttgacctt tgaactggca aaggcttttt tcttcctctt 480 ccggggacgt tgtctgcagg tatggatgtt gttctctttt ccctgtcttt atttccttac 540 caatcggctg ccatccgagg agctgaggaa gcctagagct ctcagaagca gtcctttgag 600 ctggtgtagg ggtaaggggc acaacaggga ggttggtggt gaggaagttc cttactttga 660 tctttggaaa tcccttgttc ctggtggcac ctccaaagcc gtgagtagcc acagctcacc 720 acccgggact ttgctgcatt ccaagtgtag cgtttggaga ctaacgagtt gtggtttggc 780 ggtttgagtc tggaaaatcg ccaaacgttt tcatatttta cacccacgtt ttcacagcac 840 gcctgtacgt gtccttagtc tttgggaggg cagggtccgg cgagttcggg tggtttcgct 900 atttggcttc tgcgtccaag gcccatgtca aggaagagaa aaatgtgtta gaagtttctg 960 tcttgctttt ggagatgcaa acagaataat ggcttcataa atcactcgca ctggttttac 1020 gtgtcaagtt ttggtgtctg gtaattctgt tttagtttaa ttttagtgag aggcttgtga 1080 caacaaatga ggtggttaca aggggtggaa tgggaagatt aaattagttc aagtattgat 1140 tatgttttac gttgggtagt tcccttaacg aagttgctcg tatgcatatc tgtataaccg 1200 atttgctaaa taacatcacg atgtttccag aagtgggaag aaagcaggtg ccataaccca 1260 aagaaacttg tgtaatatca aaattagtat taaagggtat gcctttacgc aggtggtgct 1320 ttagggcaag acattgaacc ctgatatgtg ccaggcattg tgttgggacg gatagcccac 1380 gtcgtttaat cctaatgaca gctgtataaa gtagacagaa ttcccatgtt agagataagg 1440 aggctagctc cttgcccttt atattcccag taaatggcat agctaaggat tcgacttcag 1500 agctcacttt ttgtgctctt tgtttaaagc ggtgtttctc caactgggct cgtggcactt 1560 ttctggacac cactccaaac aaaattagac tctgagtaag gagcctggtc atcagaacgt 1620 taaggaagtg ccacgtttga ttaccatcag gaaagctaac attcttggcc tcttgtttat 1680 cagtcacctt taaatacaag tagttttaaa atgtggaata atacatctta atttaagggt 1740 gttacataca aggatatgta tgtgaatgaa atagaccaca tgatactgtt ttgagatttt 1800 atttactttt acaatggaaa gatttgatgt tactctattc ttaatttagg cactcaga 1858 <210> 10 <211> 8450 <212> DNA 〈213>智人 <400> 10 attttgcttg aaaggatagc atcaaggaag tgaaatgaca acccacagaa tgagagataa 60 tttttgcaaa tcatgtatct gataagggac ctgtagtcag aatatgcaaa gaacccttac 120 aattcaataa gacaacccaa tttaaaaaca ggcaaaggat gtgaataggc atttctccaa 180 agatacggaa aaacggccaa taagcacata aaaagatgct caaaatcatt tgccatttgg 240 gaaatgcaat caaaaccaca atgaggtatc acttcacgcc cattagggtg gctatagatc 300 agaaagtcag ataacatgtg ttggcaagca catggaaaca ctgaagtcct tacacactgc 360 tggtaggaat gtaaaatggt gcagccactg tggaaaacag ttttccaatt tctcaaaatg 420 ttaaacacag ttatcataca cccaagcaat tctactctta ggtatatacc caagagaaat 480 gaaaacatat gtcttcacca gaacttgctg ttcacagcag cattatgcat aatagaccaa 540 aagtggaaac aactcaactg cccatcaact ggtgaatgga taagtaaaat gtgatgtaac 600 cagtcattgg actgtcattc attaataaaa agaacaaggt actgattcat gttctaacat 660 gagtgaatct tgaaaacact atgctaaatt aaagaagcca gtcacaaaag gccgtgtatt 720 gcatgatttt atatatacat gaacttttat atatatataa ttatatatat tatatataat 780 tttatatata taaatttcta tatataaata tataaaatca tatatatgat atatattttt 840 tcatatacat catatatatt tacaaaaatt atatatcata tatcatatga tatatgagat 900 atatatcatg atatatatga tatatgatat atatcatatg agatatatga tatcatgaga 960 tatatgatat catatgatat atatgatata gatatcatat gatatatata taatatatat 1020 atgatagata tattatatat gatagatatg atagatatca tattatatat gatagatatg 1080 atagatatca tattatatat gatagatata gatatcatat tatatatgat agatatgata 1140 gatatcatat tatatatgat agatatgata gatatcatat tatatatgat agatatgata 1200 gatatcatat tatatatgat agatatgata gatatcatat tatatatgat agatatgata 1260 gatatcatat tatatatgat agatatgata gatatcatat tatatatgat agatatgata 1320 gatatcatat tatatatgat agatatgata gatatcatat tatatatgat agatatgata 1380 gatatcatat tatatatgat agatatgata gatatcatat tatatatgat agatatgata 1440 gatatcatat tatatatgat atcatatata taccacatac atcatatata catcatatat 1500 acatcatata tatcatacat atatatgaac tttccagaat aggtatatca ataaagacag 1560 gaagtataca agtggttgcc acagcctgag aggagcaggg aatggtgagt gactgctaat 1620 ggatatggca ctttttttgg ggggtgatga aaatgttctg gtcagacaat ggcaattaca 1680 aaactgtata cacacgaaaa accaaagaat cacacacttt aaaagggagg atttagctcg 1740 gcatggtggc atgcgcctgt actcccagtt actcgggagg ctgaagcagg actgcttaga 1800 gcccaggact tcaaggctgc agcgagctat gatcgctcca ctgcactcca acaaggatga 1860 cagtgcgaga cccgttttct aaataataat aataataata ataataaata acccaaggta 1920 cccagttcac atgcaaaacc actggtaaac ataaattatc tccaagtaat ctagaaagaa 1980 aatgagcaca taagacgtct tctaaaaaca cacatatatt tctttacatg ttacatttaa 2040 cgtaaaaatc agctatgcag aagttacatg aacattttat gttggaaagg taaatgacta 2100 ttattaatac agaatggtta agtacattta tgtttttatg tacaaacgca taaaaggaaa 2160 agcatcctta aaataaacac catcaatggc tcctcggtgg tcacaaaaca aaatcctcac 2220 acctttgtct tccttcacaa ttgagcttta tccacctttt caggcttatc tcccattatt 2280 acctgacaca aacttgggtg ggccagagtt tccactgacc atcccccgac tattcatcca 2340 acactatgtt cactgcctcc cattcctgac catttgcctt ttgtcttcaa ctaattctgg 2400 ggacgttttg tccaaataaa tgatccatat tcttgaaggc tggaatcaag tcctattaca 2460 aatatatttt ctcaccctct ccagagcata gcaacccagc atctactggc ctctcacagc 2520 tctaaccatc cacaacccta agctggcttc tcatcaaacg ggtacttttc accacccaaa 2580 ttcaattaat tcactcttac aataatgaag aatagtcgcc tacagcctac cttttccagc 2640 cttgattcaa tcatttatca attttatctt caaagtccct cacttcaggg agatgatata 2700 tcagctttca cccagagtcc taaagaaaac agcactcttg ccaatgacat agtgccacct 2760 agtggcaaca taaggtaaat cacagtggca gtagaaggat ctccacacta cttttacagg 2820 aatgcactgc aggtaaaaaa taagaagcta cagtactgtt tggcaggaca atttgtttca 2880 tacgtgcata ctatcgccct gactaaatta actcgcaagt cttacaggta ttatttgttt 2940 tcagttccat gcacagatta gccatttagt acttactaaa tcaaactcaa tttctgaagt 3000 gtcttacacc aatatattca tgcacatatg gttaaaattt tccttgagga tctatcatgt 3060 gagagtgtgg cttattataa caagtaaaca gaacaaataa atacaaaatg aaaagaaatc 3120 gtatgattta ctcgcatata agggagcttg ttgtggatta agtttcatga cccaggacac 3180 tgaaacagaa atggaataaa tgagaataaa attaaaagtt gtcatcaaaa atatagaagc 3240 catctaaaga cctaggtgtc aagcatagct ctatgagtac aatcccgtgc ctgagattac 3300 catatgccca gctgtatgct atacactaag agatttagga aggaagcggg gtcagggatt 3360 gaccccagac tccatctttt caagtgggga agaaagatct tccgattgaa aaataaaggc 3420 aaaaaaggct tcaccgtcac agaagtttca acaaccaaca ggatatttaa aacagttatc 3480 aaagcaaaac cattgtatgt tcacttacat ttttacatag tccctcaaac tcacaaaatg 3540 ctgtttactc agggacttct tccggtctta ctagggagcc tggaaagtga cgggaggatt 3600 gcaagggacc actagaaccc tcttcctcaa ttccccttct ctgagaaggg aggctacagc 3660 ttgcctctct aaccactaaa aggcatgacc ctcctcaaag ttaatagccg gattccctga 3720 tagatatttt cactaaatga attctcataa aactctcact aagatttaga gaaggcttcc 3780 agggttgaat tcctgaacat taagaacagc atgtttttta aaagtttaac ttggtgattg 3840 gaccaggact tcatctaggc tatgaatgct cagaatggta ggtcctttac caaacagctt 3900 gagtttgtgt ataaagtgat ctcatcctct taagagtcag agaaacagaa ccaagcgact 3960 tcactataat ttgatctgag gaagtttctt actcacaata ggtaaatgaa ggcacatact 4020 aaccagcaat ataaacaaca atatcaagtg tcattcacac atgcaaaaaa cagacaaaat 4080 cccaaactct gtgttctaac aaatcgcaaa aacctcacta acaataaatt gaaatgacca 4140 aatgtttgga ctgaaaagca atgccttggt agcctagcca tgcctaactc aaataacaga 4200 accatctcga tgttaaaatc ctcacagatc aagctgtgta tgtctcgggt caagacttcg 4260 ccaaaaagca gtgagcacac acttaagagg gaaaaaatct acctcagcct cctaaatgca 4320 atcatctcta cacgagttgc aggccccaag cttcaacgtg ttctgctgga caacgcagta 4380 gaaagctgac aagcaggtgg ccttcccaca ctgactgaac cacctccatg cccatgtcca 4440 ttcattttct tgcccacccc atgtgctata acagacctcc tggctcaggg cactctttcc 4500 ttcctgactg ccttcactta atgactttgt acttttaggt gcaaaaatta tctgcagaaa 4560 tccacactga aaaccaagct tgagaaaggc agcaataacc aacattttta caagaagaac 4620 aaggtcaata tcaagcccat cagattcaaa tagcaagcat ggatgaaaat gaaagattga 4680 aaggcttgag tgccttctta atgtattaaa tatccattta atttacaatt aagctcactg 4740 tgctcactgg ccttttaatc agctttccag gtcctgctca gacttgccta ggacatggga 4800 atgaaagaac ctatacattt atggaccaat ctaccttaac taacttgtca agtgttcctg 4860 catcaagcag aagaaacatc agtgaaactg atacaggaat taaccccttg ttaatccata 4920 aaacttaaag gagcgggatc caatcttctg gcttccctgg gccacgctgg aagaagaatt 4980 gtcttgcgcc acacataaaa tacacgaaca ctaataatag ctgctaagct ttaaaaaaat 5040 tgcaaaaaag gaaaatctca taattttttg tttgttgtga ggtggagcct cactctgtca 5100 cccaggccgg agtgcagtgg caccatcttg gctcactgca acctctgcct cctgggttca 5160 agccattctc ctgcctcagc ctcccgagta gctgggatga taggcgtgtg ccaccatgcc 5220 cagctaattt tcgtattttt agtagagacg gggtttcacc atgttggcca ggctggtctc 5280 aaactcctga cctcaggtga tccacccacc tcggcctccc aaagtgctgg gattacaggt 5340 gtgagccacc gtgcccggcc aatgttttaa gaacgtttac gaatttgtat tgggccacat 5400 tcaaagcctt cacaggctgc atgcagcctg caggccgcgg ttggacaagc ttggattaga 5460 gaaatctaca gagacaaact agtgacttag tagccctctg atagctcatg atttgcaaga 5520 aacttaggat gactatgtgt aaagaccaca aacatcaatt taactgaatg gttcccgcca 5580 cactggaatg aggaagctga gcaaactcag aggactctaa gaaagggctg atgtcatctg 5640 aactgttcgg aattataaac tcctctaaac atgtttcaaa gccagaactt gtaggagttg 5700 ttctgataca cggattaaaa gagggatgac aaagtgtctg tcccccacac tggtcaaagg 5760 gacaggtcat tgttatgctg gcaatgcagg ctgctgaaaa gaatgtatct gtcaaaagta 5820 atcaaagtaa tgaccccaga aggctccaga aacagactgg taaattcagg ttgctttcag 5880 acttccacaa tgctggcaca caaggggaaa gacaaaacta acatttacag agcattatat 5940 ttgatattac atttaatccc cattaaaaag atactatttc ccgtttcact agtgaaaaag 6000 ttgatctttc aaaggttaaa ttatttaaca ccaaggtcaa agggtaagtt ggagagacca 6060 gattcaaacc cagtctgaca ttaaaacatg tgttttcccc ccacatcgtc tcctgctaat 6120 aacctcaaat ctaaaaactg acttgcccta caccttgagc cccatcctac aaactctccc 6180 tgacgttatt aattcagctg tcactgtgca cctacaacgt gccagacacc atactcctca 6240 acactctgta ggcacagaag gaacagataa aaatccctac cttcatagat attattctag 6300 gggtaacaca ggtaaataaa acattaaaat agttttcaca tagtagcaaa ttccatatag 6360 caaaataaaa cagaagaagg aatagcaaat gagggagatg ccctcttaaa catggtgctg 6420 agggaaggcc tccctgagaa agatatcatt taccccaaaa ataaaaaagc aagtaataga 6480 aaaaacaggt aaaaggtgtt ctagacactt aaacctgcca cattgagaac tcagggttct 6540 gatgcaaaac ctcgctgcat agaatgcatt aacttatttt tatacattta aacaaacaaa 6600 ctctacttaa gaactgtgtt ctaaaggaag gagcatatta caggaaggca atttttggtc 6660 agagtagaca cacttaaaaa ctaaacctat tgaaagacca agaacaactg aaagtctttg 6720 ctttgtcaga tttttgacca aaaggaaaat taaagaaaca caccgtgccc atccaatgat 6780 ttcaccaagg aattttaaga gagaaaatcc tacttcttcc tcacccagta gccagtgaaa 6840 tgactgagca aattcacaag ttcactgggg ctgctttcat gtaacacagg gacaacacat 6900 gacagacaca gtggaaccct acaggttgcc tagtatttga aagactgtga agaggaggag 6960 atgtcaaaat tcaaagtctt aaatgatgta gttttaagta tgttcagcaa tttcaccact 7020 cagtagtaaa gccagctaca gttgaaagca atcagaaatt tgaggggtgt gaaataagca 7080 gaagcacaga agttaaggat ttgtattctt cccacatttt ccactttatt ttatactgct 7140 gagaaaaaac aaatttaata gttttctgct gtataagaga gacacattca ctttatgtca 7200 cagtaagagt cactcaattt taatacaact atctcaatgt ataaattaac attctccccc 7260 ctgcccacac atagtaagtc tcttatgatg ttgctgatta gagaagcaaa agttgccgct 7320 acaattctct tcctgcattt taatataaac aatcatcagt cttttcttca tagagtgcag 7380 tgtgggcact atcatcagaa tgtaccagca ctgggtgtgc aaagtttaca aagattagca 7440 agagcaaaag tgttgagatt tttgaaattc atgctgctgc aaagaagtat gtaaaaactc 7500 actcaccata gaggaccaca cagaaactca ggcatgaagt tatatggctg tgtgagtggt 7560 ttgggagaag gaacggaaag cacttccacc aacctatatg cctgagcaaa ttaatgcaaa 7620 acctcagaag ctacaaaaaa gtttatctac ctaaattaaa attggtgtcc acagcagtag 7680 ccagcaaaat gcctgcgaag cgcaaagtgg taaatatttt agggtctgta ggtcatatgg 7740 tctctgttaa acaatatgta aatgaatggg tgtggctgtg ttccaataaa acttcattta 7800 taaaaagagg cagcatggta catccagtca gcaagctata atgtaccaac ccccggtcta 7860 acactaacca aatacctctt aataagccaa agaaactgtg tcctcttagg ccggaagcgg 7920 tggctcacac ctataatccc agcattttgg gaggccgagg cggggagatc acctgaggtc 7980 aggagtttga gaccatcctg gccaacatgg tgaaacccta tttctactaa aaatacaaaa 8040 attagccagg cgtgctggcg ggcgcctgta atgccaacta ctggggaggc tgaagcacga 8100 gaatcgcttg aacccaggag gcagaggttg cagcgagcct agatcacgcc attgcactcc 8160 agcctgggca acaagagaga aactccgtct caaaaaaaaa aaaggaaata aaagtataca 8220 aagtgaaaac aaagaaatta aactgccctt atttgccagt gacattactg tctatgcaca 8280 aaattccaaa aatctacaaa aaagcttcta gtactaaaaa tgagtttagc aaggttgtag 8340 aatccaaggt cagcatataa cataaaatca ccttcctata tactagcaat caccaactgg 8400 aaattgagaa gtatcattca caacagtacc acaaacatga aataaatgtg 8450 〈210〉 11 〈211〉 8420 〈212〉 DNA 〈213〉智人 〈400〉 11 tcttagtatg gtaaaccttt tgaagtagat tcaaatgaga atgggaagag agaaaaggga 60 gagaagcaac ataagaaatc tcttttaagg aattttatat agagagaaac agaggaatca 120 gttgatagtt ggaaattatt ttaaagaaaa tgggttattt taaagaaaaa aggtattaca 180 acatgtttgc actattgtgg gaataatcaa gttgagacag aaaattattt tttaaggaag 240 agtctaattg ctgaagtgaa agagaatgaa tgagaccctg tgcataagtg tgatcagata 300 ggagcatgta cagctcaagt aagaacagga agaaagagac aataaacatg tacagatagg 360 atgggctggt cgatgtggtg gtgaaaagac atgcgagtta ttactgatta cttctatttc 420 cccagtgaaa taggaagcca ggttcataaa ccaaaatgaa gaggagcgag gcagtattgg 480 aagttcagga aaagtaatag gtgtaaaaat atgtaaagta gaattaccag ggagtatgaa 540 gatacatttc caattaagga tgaagaattt aaagtgaggc cagccaatac ccctgctttg 600 cttcagctac atcagctgca taggttcagg cacagaatac atggaacatt gtatttaaat 660 agggcctgga ttttacaaaa gtaacacaat gaagaagaga gatgcaaggc tatttgaggg 720 tgtttgtggg agagattgta aaatattagc taagtaagaa ggggactgca aattttagtg 780 gtataaagga atgaggaaaa gtgtaaatac agtggggtca aagaatgttt ggagccaagg 840 cactagaggc aattagctga aaatgtaggt gattattggt gagtgacatg gtttaaatga 900 aaagtataga agggtacaat tatccatcat gaaaagttct agggtacaac taagatctga 960 gtagctgaag tagaatgaaa gtagaatgga cctttccata tccagccagg ttcagtgaca 1020 gaaggttagg aaacaaatta taaaccactt gagagaacat atcccctaag ttgtttttgc 1080 tatttttctt tcagcatata tttgttggaa tgccaactat gttcagttca attaatatgg 1140 gcttcttaaa taagggctcc agcactggat aatcctgcca tttattttga tacattccat 1200 cctgctgctc agatctattg gcatctacag gatgtctttt gagaagatgg gcattcacat 1260 ccctatgtcc tagcaaattt ccaactcaga aaaccacatt aggcttctct atatatcttc 1320 caactatttc aatggaaaat acaattctct gatttcttcc tatgatattt atcaaagaga 1380 atggtgcctg ccagttctag ggtgggggaa ctcaatacaa atcaccaacc tttagatgac 1440 accctgtctt caaagtgctt tcaaagtctg gcagaaaaaa agtacccagt ggctataaga 1500 ccacccagga gttcagtcat gcattctaag tagcagatca ctggaatgta attggctagt 1560 gagttcattt tactcttctc ttcttggtca catgttaccg cccttgtacc ctgcacgttc 1620 tctttcccag acttacaaag catgttctct tgaattcgtt ctctttttaa attcacacag 1680 tcttaatgat tcttctttca caagagtctt tcactcttac aattcagttc aagtcatcca 1740 catgcttatt atgagcaagg gtctgggact taggggaaaa gggaataaaa agatgaatga 1800 aatgtgatcc ctgcagtcca agagcttgct gtgaaaaagg aagtttggct tacattgcct 1860 ccctaatccc ttggctaggc cagaacagaa tattgtctaa aacctcctca cgtcagcagt 1920 cctctggggt ggtgactgga agtagaattt aaacaaaaat ataattgaca cataataatt 1980 gtgcatactt atagggtaca atctgatgtt tcgatatgtg tttaaatggg tgcattgtgt 2040 aatgatcaaa ttgaggtaat ttatccacca ccttgaagag agatttttca atattctcat 2100 tgcgaagaag caggaatttt tagcagacaa ctgagatgct tcttgttcac actaagtcat 2160 tctgacgatg gatttacata acttgttgtt ttttttgtgt gtgtgttttt gagacagagt 2220 cttactttgt cgactaggct gaagtgcagt ggcacaatct cggctcactg caacctccac 2280 ctcccgggtt caaacgattc tcctgcctca gcctcctgag tagctgggat tacaggtgca 2340 tgcaactagg cctggctaat ttttatattt ttaatacaga tgggatttca ccatgttggc 2400 cctgctggtg tcaaattcgt ggcctcaagt gatctaccag ctgcggcctc ccaaagtgca 2460 gggattacag gtgtgagaca ccaagcctgg tacatttaca tttcttatct ggatctttcc 2520 tttagtaagt gctaaggaat cctacttccc ccaatatttt ttcctatttc aatgttttag 2580 catgtatcat gttactactt tgcagacatt tgattttccc ctttgtttac tgtaaagtat 2640 atttttatag cctttgtaat agaagtattc taaaatctgc ctgcaaccta tctttctgac 2700 tctgcatttt agggaataat tctctgttgt ggaatgaaaa aaaaaacaga gcctgtggag 2760 tcagagatct catttcaaat tatagttatc cctaggaata aatctgagtg acaggtagta 2820 tagtataata ataagtataa agctatggtt aaggaaaact caacaacctt atctgtaaat 2880 tgggatgaca acagcctacg tcaaaaaaat gtgaaggtaa atgagataat gtaaggctga 2940 tacttagtaa gcaatttaaa aacacccaaa aaactattgc catgattact ctacttactc 3000 tatttctcta tgctccaggc aaatgaacta ctaatgaccc aggggtcctt ccccattctc 3060 ttcttcacaa ggaaatattc tctctctgtg tgctgtttat taaaatctac tgcccctttt 3120 agaagccttt ccagatcatc ccatggccaa gaacgatcgc tgcttcctct tctttacata 3180 cagatgtttt tctcctgctt gacaattatt tttgtgcaat tattttcctt ttgattgtgt 3240 ttttaatgtc ccccccaccc cacaattttc cagactgttt gctccacgag agaggagacc 3300 atcatctctg tgctcaccgt tgtatgacca gtatcctgag gagtggctgt tacataatta 3360 catcaggcac tcaataaaaa tttgatgaat aaacactgga ttttaaggca ggtatcatat 3420 cttacatagc atatcatatc ttacatttta tgtccctcac ataaatacca cagagtgaag 3480 tatatgacag ataaggtcat ttctcttgat aagtacatag tccagtctga aacagatatg 3540 ccaaaaaaaa acaaaactgg agtaaacaag atgaattgtt ttaatagagg cactgtatta 3600 gtttcctagg actgccagaa caaatcacct caaacttagt ggctgaaaac aacaaaaatt 3660 tattgtctca cagttataga tgttagaagt ataaaattaa ggtgtcagtg ggattggttc 3720 cttctggggg ctgtggaaga gaatctgtcc caagccttca cactgtaaag tacagtactg 3780 gagggatagg acttcaactt gctctatctc agatagagag gagccatttg ttgtgaattg 3840 agaagagggg tatgttgaat ccataataag cacataaaaa cttggctggt tcataggaga 3900 agtaacatgt ttccagctct agtaaaaaac aaattgaagt ggcctataaa aaggtacaga 3960 gtacgacaga atgaaaaata aatgaacaag aatacagaga ggatgtggta aattatcatg 4020 tttccctaat atgttattgg acactaaatg gtattagaat tatttatcaa taataattct 4080 aaactgttgc aattgaaaga atatattaag tggtgttata tgagaagtgc cagggcattc 4140 tcatttctgt ccaatgggag aaacattttc gtttgagacc tccgtgaata atacagtctt 4200 ttagttagga gagctgcatt ttgagtggtg caggcagaat ggcgatctct cacccacaca 4260 aacactaaga tagagagaga cagagacaga gacagagaca gcagagagag acagagaaag 4320 gaagtacagg tactcagata gagataagcc atttcttgac attaagaaat aaagtagaat 4380 ccattggagg gaaataaaac tgcctcagga acagagttaa ttcacataca catgcaggta 4440 aacacacact gcttgatact tactgtggac tttgaaaatt atgaatgtgt gtgtgtgtgt 4500 gtgtgtacat tcagccctcc atatccatgg attttgcatt cacagattca accaaccatg 4560 aattaaaaac atttggaaat aacaaacatt aaaatataac aatacaacaa taaaaataat 4620 acaaataaaa aatatagtgt aacaactgtt tacatagcat gtatgttgta ttaagtagta 4680 taaatctaga gattacttaa tgtataccag aggatgcata ggctatatgc aaatactatg 4740 ccactttaaa ctgataagaa cagatactaa acttcatctt agccaaaagt cagagaaaca 4800 atataactat gccattttac ataagggact tgagctgagc atcctcagat ttcagtatct 4860 ttggagttcc tggaaacaat tccttgtttt atatatatat atgtgtgtgt atatatatat 4920 atatatatac acacatatat atatatatat atatatgata gctactgagt gacaggtgat 4980 attataccat accacttgtc actcagtagc tgtatatgca tatgtatata tatacatata 5040 catatatgtg tgtatgtgta tgtgtgtgtg tgtgtgtgtg tgtgtgtatg ctgtctttcc 5100 tcggtatcac agggaattgg agatatatat attcttttca gtacaaaaaa aattgaacac 5160 agatgggtat ggtaccagaa cagaaggtaa agacacatga aaaaaatttg caacaacatg 5220 aatggaactg gagatcatta tttgaggaga aataatccag gcacagaaaa acaagcattt 5280 tattatttta ggtgaaagac aaacatttta ttttaggtga aataatccag gcacagaaag 5340 acaaacattg catgttctca tttatttgtg ggatgtaaaa atcaaaacaa tagaacgtat 5400 ggaggtagac agcagaagga tagttaccaa aggctgcaaa gggtagtgta ggctttgagg 5460 gtgaggtggg gatggttatt gggtacaaaa aatagttaga aagaataaat aatatctagt 5520 atttaatagc acaacaggtt gactatagtc aaaataacat aattgtacaa tttaaatatg 5580 aaattaaata tatatacaag actagaacac caagttgaat gactccagct tgcgaaaccc 5640 acattgatca ccatgcttgc cccaagggaa gctgtacaat gtctggctcg tccagaaccc 5700 catcatttat cactagcaat ctattgtcca taatcatgtt taaattaata gcattttaaa 5760 ggtacaaata ttttttaaaa aacaaataat tatttaattc gccttttaaa agctttttaa 5820 aaacgttttt aaaaactttt ttaaagtcct gaggactatt ttctttaaag tgctcagtta 5880 cagagctcca tatattgggc tatgatagcc ttacctgatt cttgccaaga atctagtgcc 5940 cagaaaatgc aaatacaaag taagcaactg aaaaataaac aaataagttg gaggtatgct 6000 acctgttgaa atatgaccta gcgcaaacac ctatgccact tgcttatgaa atcatatagg 6060 ttttcggtgt gcagttttga ctgaatgagg gagtttacgc tggaccacaa gggggcccct 6120 ctgtcaataa cgtactccat ttgtgtatta agtcaaaaat gaaatggaag agaaaagaaa 6180 catcgatgac cccaagtctc tttaattgaa tggaggtaaa agggaaacaa cgaatgagaa 6240 aagtactctg cccttttaag aatcttgcat tcacattcct gatgaagtta tttttcctcc 6300 tctcactgat tcccatttca ctctattaca tagcaccgtg ttccccagga gctcctgaat 6360 gaaggacatc actcagctgt gttaagtatc tggaacaata aatatactag tttcaatgtc 6420 taggctatgg gtattccttt ttactgaagg tatgacatat agctgcccag gcctgactaa 6480 attaatagta ataataatta ataatggcaa atttttattc tattaagtta cttggcttga 6540 cttgtagaaa tagcaacatt catctgaaat gccccctcct acacttatgt ctaaggacaa 6600 atcccacata caccacagat aacttcattt tacatgtttt attctgttac caaactaaat 6660 ttttatcata tagtctgttg ctcactgaac tcttcagtaa ttctcaacat accatgtaaa 6720 gcattaagca cagttccaac acagagcaaa tgagcaataa ctgttagtta ttataacatt 6780 attatgtgtt ttcagtgcat taaaccactg gtctgatacc tagcccaaca ttctattaaa 6840 ccacataatc cagttgaata atatatgata atataataaa atggcgataa gtgctaaata 6900 tccagataga aacacagatg gaatcagaca gctttcccaa gaaatagaga aaatagtaga 6960 taggcgatct aggcctaagc actctaagca gaagctaagt tatcacagga tatcttggca 7020 atctgtggca cgtgaaccct tttcttctgg agtctggaac tatgttgcaa ctctcacttt 7080 ctccctatct agagactcag tttgttccct tgtgattatc agcagttgag aaatccttag 7140 accttctgaa aggactactt tttaaattta tatatataat atttaaaata catatcttta 7200 tatataatat atatttaaat atataatatt taaattaata tatatttaaa tatataatat 7260 ttaaattaat atatatttaa ataaataaat ttatatttaa atatataata attaaaatat 7320 atttttaatg aacagagagt aaaggattat tttgaagaga aactcctggt tcccacttaa 7380 aatcctttct tgtttccaag tttttcaaat ggagccctct ttaccagctt gccccctcag 7440 agataagctg ttcccctact tattcagatc tgagatctga aaacattcct tttcctgtga 7500 gttcagctag gacaaagatg gagctttttg ataaaatttg gcaaacacat tttttaaaga 7560 tgaaaatttt taaaaattga aaaaaaaaca tttatagaaa gagacttcta atccaaattt 7620 aacttctcaa actatgtttt gaccggctag cataatgttt cagtctttct ggagaatgcc 7680 ccttgaaact gttttcttct acacaacttc ctcctttcct ttgactttcc tgctctggaa 7740 gggaagaaca ggaagaggac agatcaaatt actcaagagg aaggacaaga aataaggaac 7800 caaattatca acaattggag aaagaaagct gatgtcagta tcatttcata tatgattatg 7860 tcagagtcag gtggataagc caatcctgtt gaatagcata cttttcctgc tactcctgaa 7920 gggtaaagag gtctttctct tacaaagccg tcctagctag taatcttaca ggtgcaaaaa 7980 gcttgttttc atgttatttc ttagtaactc aaaatacctc taaagttata catattatga 8040 aagtactaca gtcacagtgc tgagaaaagg agtaaataag acaatgtata taaaaacact 8100 tggctcagcc cctggctctg tggttgataa atattaagtt agtattcatt attattataa 8160 tttccaaaga gtccattaaa agatatagaa gaagggaggc agcaataaca ctaagagaaa 8220 attccattat ctccaactat ttatcctcta gcccaaaata attgccatta gaaagagcaa 8280 ctttaacaaa aattttaagt tgcaatagat gttcaacttt aaatccatcc cagaaaaatt 8340 tctaaccaaa ggagcataga agatttgatc ttattttcta agtagtatag acttaattgt 8400 gagaacaaaa taaaaacttg 8420 <210> 12 〈211〉 8475 〈212〉 DNA 〈213〉智人 〈400〉 12 gcataacttg taagaaatgg agtgaggtct cagttcaaac tggcttctgt atgacttcaa 60 agccaaagtc agcaacttag aaggcaaaaa ttataattta gttggcaaat acgagaaaag 120 gtcagaaaca catgaaatga agctcaatag gaacacttac agggtagcag ggtagtagcc 180 tagggaaaaa agtcagacac taaaattgtt taaataggta agttcaaggg acaggtaaag 240 accttagtgg gtaagaagcc aatcagcaga cgaactgcaa gcaagcactg tctctctttc 300 ccttctgtct cctcttgtag taactgacca caattaaggc tgcctagggg aataatgaag 360 taatcctcct attatcagca atggtctgat ccagtgccag gcaccacaga caacttggtg 420 ttcagagaag atccttcaag atgaacaaag ggtcaaaata aaaaattcta gaagagagaa 480 gactgatcac aatttaatgt aaggcttgga aggaactgat ctctaccttc cttaacatct 540 caagaacttc ctcagattca ttggatgttg agtgtgtgtg agtctagtag aaaaatgaat 600 ttttgtttct taacttggat atgtgattag gatgttaata attaagtctg ggctaatatt 660 gaaggtatct tatgatgggc ttcttaaagc attgatcaca aagactgcat gttcataaac 720 tgagctgcac ttgttaggat tctagatgtt tgaaatttct tgtgttattt tggtctcaga 780 tttctagaca aattttctca aattcctatt tcactttttg acatatcatg agtgactcaa 840 atgtttgccc ttgagtcgga aaacacccag cattaggaat aggcacataa acataatact 900 tcaagcttca gatttaagct caattataaa gtgtttaaag gctgtgctga tagttcttct 960 gagtagaatt cctacaacta tgggtttgtc tataataaaa tgttcactct atattgaacg 1020 ccttatttaa aactcgaaat gtgtaagtag taataaagaa aatatgtcct cctgtaacca 1080 aagctaggac cgattacatg ttcacttgac tgacagatac aatcacctat attaggagca 1140 atcagcactt ccttacaaac taacaacttg agatgtagtg ttcccattgg ctatgaagat 1200 tttctttatt tactcagaat agtctgtagg atctgccagc tgcccctgat tataccagct 1260 gcacccaatg atcacagtga acattatttt acattctaaa taactggtgc aaggtgagcc 1320 atggttttct gagtttccta tcacctttgt gtttcaggtc ctcaaatgtt aatttgtaaa 1380 gctgctgttt caggcaaaac taacaaaatt agcatctaat caataaccat actatgtcca 1440 cccatatcct ataacacaga agtaggggaa gagtgagaaa ggtggaagtg gagaaataga 1500 ggcccaaaaa gaaagtttta tcacaggaat atctagatgt cttctgggat tgtctgttaa 1560 agagctgtga cactcatata aatgcagaat tactctcttt cttccttgtt ggttagaagg 1620 ccaagggtgc catggtaata ctaccaaaca tatatcaaag cttggcagga aaaatggtac 1680 cttcagaaat tttataatct gatatcaaat aggtcaagaa atataataaa actagtttct 1740 ttggtttcct tagaaacctg gaaaacttta aattagaaac ttagaaagct ttaaatcaga 1800 ctttgtagtt aaaaaaggaa attttagttc cttccagcat tagaattccg tgattctctg 1860 actctgagcc tggattaaat ctagcccagc tgagtggaaa cttaagtaac tagctggttg 1920 cctttagtga tcttccactt tatggctgct tccgcctaag aagttcatca tcgtgactta 1980 ctttctttgg ggcaaagtcg tgactaactt tctttggggc aaagttggaa agcagaggtc 2040 aaagtcaatc agaaatggga caaactcact tcctactgcc tggtgaaggg gccattttca 2100 gtagcccctt ttcaagatta gtttcattca agatttgata agctgttttg actttactat 2160 agatcttatt atccatgtca gttaagttta tgcttccact aaatctatct gaattcaaaa 2220 ggtaaaaagc taatgctcag tcttatcaga tttatcttat ttattaatag aatgtggatt 2280 tttttaagca tataacaata atagtaatga taggaccata aatgtggatg gctctttaca 2340 agtcactaac attacataaa ttcctcaaca acacactctg aggccataac aaacttttag 2400 aaataacaca attggctacg gaactccagc catctagctt catgggctcc cactttaatt 2460 tcaaaacaac agaactgtgc acattcattt acatgattag ggcagagctt aactgtatct 2520 catgtagcac ctacatcatt cttcagacaa acttattgcc ttttacagac aagaaaactg 2580 gggctcaaaa aaggacttgc ttataactgg ctaataaaga ggaactctgg gttcaaagtg 2640 agtccaattc tttcttccac ccacagcttc tgctaaagtc attacagaaa tgcatagagc 2700 agttcttcca cgttattgct taggtttcta aagagcagtg acctaataca acatgctcta 2760 taatttatta ctgatttaac tatttcacta aggattcact tttaactttt aacttgtaaa 2820 tatgtctaat aaacaccact gaaatagcaa cctctttctt catggccttg tggttgtaaa 2880 gcaagctagt aatatatgtc tgtggatttg tgctaataaa gttctataca cctcattaat 2940 tccacaaatc ctactgggta tttcttatct gccagatcct acgctaggta ctggatacac 3000 agtactgaac aaaatgggta caaatgagcc tcacagagct tgtttcattg aaaagcagag 3060 agatacacac taatcaacaa attaatagta acacactacg atgtgttttg aaggaaaatt 3120 agagcatcaa agagacggtg ttagcaggtg gaggggagct cttttagatg gagaatgaga 3180 atgcctccct aaagacatgg gaataaattg agatcacaaa aaatgagaaa tagccagcct 3240 tgagaagagc agaaggaaga acattcaaag gaaaagaaag tgcatactgg aaagcctgaa 3300 cactagagtt tggtgtatgt aaggagctga gcaatggtca cttgtgtgat aagatgtgtg 3360 gatgtggggt ggggggcagg ggtgagtccc acgcagctct taagtgtgtc ctcagactcc 3420 tgtggtttcc atcagccaca acctgaataa ctgtgtggta atccaaaaat gattacagat 3480 taaacatata aaaatatcat tacacccata gtacctaagc caaggacaca gtattctatc 3540 ttttcaatga agatctgcat gaagtaaaat tattatatat aattttaggt attgatatag 3600 atacatcagt ggatagatat agatatgtgt ctctggtata gaaaaaagtt ttaaagggat 3660 attaaaagtt cttatcttgc agggttgaag attgtggcaa ctttcatttc tttttaattt 3720 taagaaaaaa gtggtattat gggggattag catgtttgtg ggtatatgta tatttttaat 3780 taaaaaataa acaacaaaat gaaaacgttt ttcttctatg aaagcctaat aagaagaaat 3840 ttcagctgtt ttaacttagg gagctaaaaa catcaaatcc aagaatgttc tctggaactg 3900 agctcaatac atttttattt gagtaagaat tggatacatt tccatcccct tggggctcca 3960 gtctgtcaat attttacttt tcagcgataa aaagacacat gtagataatc acagtgacct 4020 cagtaacttt ccttctctta tttaagttta ttttatttct atcgtagttt tccctgttaa 4080 agattttttc tttttgctta catatataat tttagagaat aacaatgcac acacaaaaaa 4140 ttcctcttgt tctgctagac ctggactttt tctctaatat atatctccat tttttgtctt 4200 ttttcagacg tattttggaa gcaaaggaga gaattgctat atagctgact tcctcttctc 4260 atcaacagtg ttttaacagt ttttaagcaa aagtcagctt tgtttatcta agattttttt 4320 tgctggcatt taacctaccc ctgcctcccc tttcccaagt ccacttcagc caacctctca 4380 ttcgacaggt accaccctct aacataactg aaataatgtc taccattact ggatcttgct 4440 agcaaagaat ctcaaatttt cccacttggt tgtaaattat tttgtaatct ctagtgttta 4500 aggtgcgctt gtcctatcta atcccctccc tggcaggaca ccttacagaa cctacccctt 4560 acactagtca ttaagcacca tcagggacgg atggctgtgt cactggtctg tttggtattc 4620 cctactgatc ctaccatgtg gtgattatct atgacttccc taatccctgg ctgccttagc 4680 tgggactggc tgacatgctt ctcaggttgc cgctggcttt acagtccttt actgcccatg 4740 ccactttgga gataggcagg gctagtactt ttctatataa gcccccaaac ttgactttgt 4800 gtttcacagt aggtgaaaaa gttgggtctc ttttctttta cttttctttc cacaagatga 4860 taaagctagg ggaagcctgt ggacatggtt tatttctgca actgcaatga ttgattggtg 4920 cttcctgctg cttacttcct aaactttgtg ctcagtgtca gatccctagc agtttctatc 4980 ccctgctctg ctaaaaaaga atggatgttg actctcaggc cctagttctt tttaattaaa 5040 ttgtattttt gttatcatta ttattattat tattttgaga tggggtctta ctctgtcgcc 5100 caggctgaag tgcagtggtg caatcacagc tcactgtttt agcctcctga gtagctggga 5160 ctacaagcgt catgccacca tgcttctttt taatttttta aaatggtttt ctgccttcaa 5220 ttctaagcac ttctcaattg taaccaagag ataatacttt ttatgaattc ttaaagttat 5280 caacagatac tcaaagtttt agcaaagtct aaatgatatt aagcttgtcc ttattgccca 5340 agtgacttca atgactattt gttaattgca accaagggtc attttttaaa tgaatatata 5400 ttattattat atatataata ttaaggtcct caaataccta aaagtttagc aaaatctaaa 5460 taatattgtg catattcttt tattactgta ttagtccgtt ttcatgttgc tgataaagac 5520 atacccaaga ctgggcaatt tacaaaagaa agaggttcac tggactcaca gttccacgtg 5580 gctggggagg cctcacaatc acggcagctt acgggattgt tgagaaatga cacttctcaa 5640 gctggggcta aactatctct gtggtagttg ttctgattca agtattgaat tggttttttt 5700 tgtttttttt gagatggagt ttcgttcttg ttgcccaggc tggagtgcaa tggcacgatc 5760 tcagctcacc gcaacctctg cctcccgggt tcaagtgatt ctcctgcttc agcctcccaa 5820 gtagctggga ctacaggcat gagccaccac acccagctaa ttttgtattt ttagtagaga 5880 catggtttct ccatgttggt caggctggtc tcaaactccc aacctcaggt gatccacctg 5940 ccttggcctc ctaaagtgct gggattacag gcataagcca ccgtgcccgg ctggagcatt 6000 ggtatataaa agctgcctag gtaactctaa cctttggccc catacatctg aaggatacct 6060 acaatgcacc tgaaaaatgc aactgaaaca gtagttccct gggaccacac actcagaaag 6120 ggggtgtatc aggagatcta gggaccagga gggtggaaga cctaaggcag cactacagat 6180 gatggagaaa aacccactgg ggaggggcga tcctaacctt gagaatcact gagatcatgc 6240 agaagtattt gatcctacag cattaatatt gtattgtatt gtattagtat atatatatag 6300 tgtatatata tagtattagt atatatattg tattgtatta gcatatatat actaattgta 6360 ttgtattgta tttatatata tagtattgta ttagtatata tatacagtat atatgtatat 6420 atactaatac aatgtactaa tacaatacaa taccatatat atatacacta acacaataca 6480 attagtatat atatatatat atatactaat acaatacaat actatatata tactaataca 6540 atatatacat atatactcac caagacatat tagtggtctg atgtctggct gccacactca 6600 tcttctacct tcagctctgc tctaccaaat atcatttgtt tctgggatct ttgcagtcca 6660 aggaacttca tccttgatat cccacccctt actaactttt tttttttttt ttttttttga 6720 gacggagtct cgctgtgtca cccaggctgg agtgcagtgg tgtgatctcg gctcactgca 6780 agctccacct cctgggatca caccattctc ctgcctcagc ctcccaagta gctgggacta 6840 caggtgcccg ccaccacacc aggctaatgt tttaccgtgt tagcaaggat ggtctcgatc 6900 tcctgacctc atgatccatc cgccttggcc tcctaaagtg ctgggattac aggcataagc 6960 caccgcaccc ggccacccct tactaatttt tagtaacgtc caaggattaa aggaaatttg 7020 ccttacctat ttaacaggaa tcaacagggt taatctcact ccctttctaa aaataattta 7080 taaacattgc agacaatctc atctatccct gtctaaactg tgtggaatta ctgccattta 7140 atgtaatcag tctactcatt tagtttgcct aaggaatttt tgaaaaaaca gttaaatgaa 7200 tgacttaatg gaataaccag gaagttgaag tctccaatag taagaatgaa ctcttgctct 7260 ctggataatc aaatgggtcc ttcctccttc aggtagatca tgccatttcc tcacttacac 7320 tgaacaggta aacaacataa ttactgactt caacttctag ttaattcctt cttttatcac 7380 tgagtatcct ttggctggga gttttgttgg ctatgctgcc attttttcta gttatcacag 7440 tcctataaca taccaatcct tcaatataac tcatctttaa attgtggttt taccttctca 7500 agaagttatt aattatgcca gtgctaaatc ttctaaaatg attgttgact tgttgattag 7560 cccccatgca attcccctct cccgtccctc agcacgtaag gaatggccct ttgcttactt 7620 ccacagatcc ttaaatctac cagttagaag ctaatagcct acctctctac caggaaggaa 7680 ctgtgggctg gaacataata catgttgact tataatttct tagaaaattg tgtgagaaac 7740 atcaaactcc tgattccagg atatgccaaa gacacatcat taaaaagcaa aacaaaacaa 7800 aacaaacctc atttgacgtt gctagtagtg gcatatttca tcaagatcag ctcaaataaa 7860 tagaagtgag attttcacac aaattagact gtagtgcttt tttttttaac ttatctttac 7920 catatgattt ttaacggtaa aaaaaatcgt ttgagatatt agatgtataa tatttatcat 7980 ccaattactt cattagttca atcttttttc aatggcgctc ctgcatctga gaataaggtc 8040 agaaaatttc atgttctgat ttcatgctga ttttcagaag aaaaatgtta gttttgtata 8100 gaataaccca tcctaagaaa tacatttctt attatatttc ttatcttata tttcttagga 8160 caatgagcta ttcaaagggt gatgataacc agcaccatca gtcagcatta tctaagaata 8220 agaatctgtg tttctacata cagacctcct aaaaaggaac ctacacttaa caggattccc 8280 caggcaattt ggatgcacat taaagcttga gcaacactgc attagaaagt tagttttcca 8340 tcacaaaaac agtaacaaaa ggaatataaa gtaagttact ttaataatat aagaagaggg 8400 gcaggccggg cgcagtggct cacgcctgta atcccagcac tttgggaggc tgaggcgggt 8460 ggatcacctg aggtc 8475 <210> 13 〈211〉 8401 〈212〉 DNA 〈213〉智人 〈400〉 13 tttcatctaa gactacattt ctattgtttt atataatcag cccccctaag atcaacatgt 60 ccacattttt tggcaaagac aaagcctact gatttcagga tcattatttt cctttttcaa 120 aagcacaaac ccaaactgag aaataaatca agagaaattc tccttttttc tatgctaatt 180 tagaagtaga gtctttattt cttttcaaac ccaaagagaa tcagacatac aatatgaatt 240 tatctacttt cgcttgctca gactgagagg aaagattaat attttcaggc tgttagtcaa 300 aactgttcat tcaaatatta tttaataaaa tccaagaacc agctaaaaag tcgcttaagc 360 taagaaacct tcaccagcct catgggaaat tgtgtacagt tttccactag aatagcctat 420 aaatgcttac tgaaaatgtc taagttcata tcttggtaac taacatttta attcaatctg 480 cagaataata tatgcttctt tagtgctaag atatgaatat tagaggcatt ctttcttaaa 540 atttctattt agttatactt tcacaaataa ctatataata ttaaaattct gcatgtggca 600 taaaacatat tttaatggag aaggtaatgt gtagggagtt tatttctgtt tgctattaga 660 acttgtgttt attcttggtt aaaaaaactg cagattacaa catagaaaaa aacaaaagta 720 tgttgtatat ctcttacagt agaagataaa gagtagttct aaatttagaa aggaaaaata 780 aatatacaca gtgaaaatat gtgtcagtga gatgttaatc aaagatcaac tattgctgag 840 accagcaata ttaaatccct gcacaattac tcatattata atgagaattt taaaaagaaa 900 atatgaacac ataacataat gaaggcagaa gtcactctca tccttcatct ttgtattccc 960 aattcaggaa gctggtatag tatcttcatt ataattacta ttcaacaaac atttgtaaaa 1020 tgaatgaata aggaatgaat gatgagaaaa atgataaaca tctccctctg tctcctggga 1080 gttaactgca ctactttctt ttaaatttaa ttaatcctca atgtccttgt aaaatagcca 1140 aagggaaaat gtatttacat tactctaaat attgatgcaa tctacaaaaa gtgttaaaca 1200 acttcctcaa agtaaataaa atgttcacaa tccagctagg ataaaaggat ttaaatcatt 1260 tcctaggtag agggctttca attagagccc ctgctgcatt aaccatggga actcatctca 1320 ctctcttcat gatggagccc tgagtgttgc tgctaatctg tactctacca ttctaatgct 1380 tttaaggttc cttttcagcc cttcctcctc gtaatccaca aatactgaga ccaaggcatt 1440 ttttgggtca gtcctaattt caagcattct atcctgccct ccccaaatga actcacactt 1500 attagaccat atgttcctat attagttcag gaagggggaa aaaatgttaa tcacacttgt 1560 atataagaga tcatagaaaa acagtttact aacctgtgaa aataccattc attctctgtt 1620 tacctctggt ccacagctaa gcaatcagca ggatataaat gtaccctatg ttcactattc 1680 agtattcata agtatactac ttatgaattg gaaatctgac acaacattta catgacctaa 1740 ttttgaaaat ttaaaatagt gtaaggcccc taggcttaat tttacagggg aaagattaaa 1800 gggacacaag caaacatata ttctctctct gtgctgtggg acactggtaa ttttttgact 1860 taaaatattt gatacttaaa atgccaaact tctacatttc tgcagtaaca aggcagttat 1920 catattgaat accatttctt tctctccagt aagtagagtt aatattagca catgaactga 1980 aaatattaag tgattataaa aacgtccaaa taaattcatt aaaatttagc ttggcaaaat 2040 gttagtttca tgttcttggt agaagtcctt ttatatttat attcaaatga aatgaacaat 2100 ttacaagcaa aggaaatggc atcaaatatt tcacaccctg cctcccaagg tgtattgatt 2160 catgcttttt gctcagatct aggtttctcc actcaggaaa agaggagaat gtacccatac 2220 ttgggaaaac aagtttccga tggcacagct ttgatcaaac agcaaaattc tatccatcta 2280 tgtattgcca tctgacagta tgacaaatgg tcccatgtgc gatattcaca ctgcattgca 2340 gtcaaacctg taagtcaaag gatatgaaat aatagtaact atacattaag cacagaagaa 2400 aatgaaacaa acaaaaaggt tttaaaccaa ccaaaaatat gtcttatttt ggatgttcta 2460 tatgttctta cattctctca ggtcttttgt gtcattatga acacaattct aacaagcttg 2520 attattttat ttccattcac atattacagg caacaagctg aaaaagtaga acggggtgta 2580 gagagacagg acaaagtaca gattagggct tgaagtgccc ctgaccagtc gacagcaacc 2640 acatggaata atgactcatg tgcattaatg atcacactaa atgatatttg tttttttacc 2700 tagtccttca actgacagct taaagaactt caggttgttc tgattcttga gcctcctcta 2760 cagcttcaga gaggactttc attttatttt ggatcaaatg ctccacaact agttgaaact 2820 ggaattaaat tttatatgaa gttcctagat gatttaaagc tgtaagaaga agaataatga 2880 atcataagaa aacttgctgc tacagatatc aaaaaggaat gttaccatcc ctcatgctaa 2940 tccttttcat tttaaataaa caggatctaa aaaaaataat gctgggaagt cctaaccaca 3000 tcaagaatgc ctcagatcag tgacccaggg aaccttccag aatggatgaa atagacccaa 3060 agctgaattc acctaatttt agggccaaaa acccaaaaaa caaaacaaga ccaaaaaaat 3120 cttcagatac tgggagaaca aatctcaatt gctcaattgt atcttatgaa aacaattttt 3180 caaaataaaa caagagatat ttaagattca ttaagttctt gtcatttcaa attttaagaa 3240 aaatattttc taatggaatt acatatattt atatgattct tctagttata tccatggtaa 3300 taaatactct tttcagttgg aaataaaacc catttgtgct atattattag ggaaaatatc 3360 tacataaatt agtttttaat ttaactaaag tctatctttt gaattcataa gcataaaatt 3420 ttaaccactt gcaaaattta taacacactt aaggtagtca gatgccttgt caagtagttt 3480 aacaaaagtg attttcacct gtttgtttta ataacagtgc atcgatttta tgaaaatcag 3540 gcatgccctc gggtcctaac aaagtatacg aagctgaatg gatctatgcc aaatatgcca 3600 gattttactt tctgagtctg attttatact tctgtcctct ttcttaccac atggcttcca 3660 gtatcactta cagactaacc cttcaaaagg agaaggctaa gttactaaca tttggaaggc 3720 ttatgaaagt gaagcatagt tatgagccag caatgttttt atttagggaa tgtgtgcaaa 3780 ccatacactt aagcaagctc tggggaatga gagttggggg gaatcaactc ttttatttgc 3840 taattggtat ttcctttaaa agatagagtt cttccagatt ttaactgtgt taatagttac 3900 tctagaaaaa ttggagattt gtgtgcatat attttatgtt gtaaacagac acatacccag 3960 agacactgag agagacagac agacagtaaa cagaggagca ctaaccacaa acggtttaca 4020 aatgacctct gtgctcattc acctgtctgt tccccacctt gccttttata gcaactatag 4080 caacagccat gagagtcatt gtggaaagaa ataaaataaa attaaaaaat cctggaagct 4140 tgtaaagaat gtgagcaaag gggaggaagt tgtgaaaaaa atgaataaag ggcaccgatc 4200 cagagtattg aagaaggcag agtggagagc ctagtaatga gtatctggta ccccagtatc 4260 ctctcccaca gaatctgtac agctctccgt ttatgacagt ttaaacttaa tttaaattat 4320 caaacagaca ctttcctcaa acatataaat gatgaggcag ttcattcagg ctgtatgtat 4380 aaagttgttc cagccacctt tttctaatgg cttctctata tcttttacat ggagacaatg 4440 agagatttgc ttaggacaat ttgactgtaa tttagaagta ggaaatggga agtatttgta 4500 tcttctttgc ctaactcaca ttagttactc aagtaagcat ttcttccgtt attgcatttt 4560 cctgattaca agttttatgt tttctctaaa acacatatca aaagaaatgt cctaagcact 4620 atgcaggggg aagccatgac atttatccac cactgtcagc aaaaacatga acttagccct 4680 caacagaata tttcacttca ttctagtgtc acctctgcgt cacctgcact ggagtcacca 4740 cttgcctgtt gggtaagacc aggatgcacc gctgaaataa aaaggggtca gacaatacaa 4800 gaaaagccag tagaaattgc caaatgtatc agaatacaca caggctttct aaggatatgg 4860 cccaagagga aggctctaga gcccaccctg aaacaggatt tttgacttca cagataaatt 4920 atttaatttt caataacaca attcaattaa agaaagggaa atacaaggct aaacaaataa 4980 gaaatgaaga caaaaaccca acctttcaaa tctaaagaaa ataatctgtt ttaaagacac 5040 agatgaagat caggaaccca aaacagaaga aaggaaaggc aattaacgct ggcatctgat 5100 aacaacgaaa agtatggagt ctggagaatc gctagactct aaaaattata aaggtttaga 5160 cttggacttt gtacactgaa gaaaagaaaa ctgcatgcat ttatactgac caatgtacac 5220 tattgctgct ttttaacttt tgtgtatatg tagggtagat ttttttttaa gtgaaagcaa 5280 gcttattaag aaagtaaaag aataaaaagg tggcttctcc ataggcagaa aactagcgta 5340 gtttttttat tagaaattgt tattcaataa tagtacatgt tacaaataaa taccatttta 5400 aactgaaaaa attgtagact ttcaaatcag ttagggtggt caccctaaaa aagggcattt 5460 tttcccctta gtctccttgt tcatgttgct cacaacaaga aatgggctaa tgctatgaat 5520 aataataaca aacactgcct tctgtcaggc cctgtgctga ataccgtctg catatgtata 5580 ggaaagggtt aactcagcag gtcttgtttg cccagactct gtacatttcc aagaaaggtc 5640 tgcctttagg actggtcctt ggccagctcc tggagaatga gctctcagct tttagaaaat 5700 tctatctgct aagaatagtt ttgcatgtct caggtcttgg gccacaaaat atcagtttaa 5760 tcagatggtt tatgttaaca agtatgattt atggcaaaca tagatctcta atctccattt 5820 ctctctcata tatctatatt tatctatcca tatatatgta cctatatata tcaaatatga 5880 agatatgttt atagcaattg catataaata gagagatagt atgtagtagg aagagagaca 5940 tagatattat tcttcatttt agaatgttat cttggtatgt ttaaaaggaa aaacttaaga 6000 tgtgttgcaa ttgcagtatg agtttcaggt atgtacatgt tatgtgtgtg tgtgagagac 6060 acacacaaac acatttcaaa catgttttat gtttaagctc aatattcaaa cacagaaata 6120 taacatctat tcttaatatg ttttatgtaa gtacagcagc agcattatta aatactgtat 6180 ttctatggtg attgaaaatt agtaggcaga gaatttttgt aatggttctt aataattttt 6240 gtaatagtaa atgattactt tttgtttagt atagttttat aatctataca tgaataaagt 6300 ggatatttct attcatatag aaatgtgatt tactctcatg tacttatcta catgctaaaa 6360 ccataagtta tcaattttag ttctgtgcca aggcactttt actgaataaa aataatcagc 6420 taattttata ttttcctgat tcaaatttat atgcccgtgt aatgttccgg ggtttttttt 6480 tttaatttct gtaaatcaga atattcagat gttgaaaaag tctttgcctt cagatttaaa 6540 agataccttt gaaatgtagc atatcccaaa atgcaaccca gaggctggca atgtcaacat 6600 ttttctgttt taaaaaacct cttatgaaaa ctattgccat actaaatttt ttacttgctg 6660 atgacttaca gctggaaagg attctgtaca tataagacat caaatattga ggatactgga 6720 acttttaaat taatggcaaa gaaagtcaac aaaggaagtt catatgaaat caaactagta 6780 atatgattac aaaaaaaaaa gtttaaaatt tttcttggcc ccagtcttat catttctgag 6840 ccaaatacaa ttctatcgaa atcacctgaa actgaaatca ccattctagg ctggttttcc 6900 cataaagatg gactgctcca aaaagaggaa tcaagaaaga atttggctca cagtgaatta 6960 ttcactttgt cttagttaag taaaaataaa atctgactgt taactacaga aatcatttca 7020 aattctgtgg tgataataaa gtaatgacca cttttcagct ggagggacta acttcttttt 7080 tttttttgct gcatatatag ctgtggtaca ttttaatgtg aaatgatgac tgcatcagct 7140 tatatccatg gagcagattt tagcattcag cttgggtctc ccagtcaata tctacgagtc 7200 tcttcttaag gagatcgatg acacagatac atacagacta acaaatgtga taccaataat 7260 caagaattca ctcagttaag attttgccca ctgatttcca cacaagaaac ctagaattta 7320 ctagattctt gtgcctgtga ggctccactc atttccctga atcacaaaag ctacagagta 7380 tttagataga aatataccta ctcttaacat gaaccatttt aaatatatgt attactgtgt 7440 ccacaggagt acactttaaa gcagggactt cactcttcaa tctctccaat cacgtgttac 7500 ctaaagtggc atgtggttcc ctaaagctta ataactgaca ttgccttaaa aaaggggttt 7560 gcttcccgac taatgtggaa aaagtctgaa aaatgatttt aaatctttca ctaaatttct 7620 catttggtca cgtggaggaa aatgatttca ccaaatagat actctcatta attttttaat 7680 gtaatttatc aaagaaatga aatatttaga taaattccag atttccccca ccatgagctt 7740 ctccgaaagt atactccatc acagactgct cactaagaag ctctactgca gtcaaagtga 7800 ccgaatttaa ggggacataa tgactacttc tgctacacag aaacattatc catctctaac 7860 acttccctat gagatggaag acggacttct aatcaggtac cagagagggc tctgccaact 7920 tcagggcttt gatgaataag aatggttgag agcgctcatc ataaatgaat tcagtataac 7980 tgagtgagaa agtgagagaa ccagagaaat aaatcctcat gtagaaaatt taggggtatg 8040 aaatgccaaa tgccagttaa ccaaagcttt ctttgtcata aagcaacttc tataaaaatt 8100 gctgaaaata aattcttcat ggctcaatgt gaatcagtaa tttccatctc tattacactg 8160 ttgtttaccc aaaaactatt tttaatgact aagactcaga gtttgccaga gtgttttcca 8220 caaaacaact gttttgagat actccagatc tgtaatcaag taagtctgaa aaaccccaaa 8280 tacctcactc acctcttgga tatgcataaa gcacactaat atataacgtt ctaaaaagcc 8340 aatcattaaa accgttttat attgtttaag catttcctag acatatttgg ctacaaatct 8400 a 8401 〈210〉 14 〈211〉 8427 〈212〉 DNA 〈213〉智人 〈400〉 14 gcacctgcca ccacgcccag ctaattttct attttcagta gagatgaggt tttgccatgt 60 tggccaggct ggtctcgaac tcttgacctc aggtgatcca cccgcctcag cctaccaaag 120 agctgggatt acaggcgtga gccaccgcgc ctggccatat taacaaattt taaatcacaa 180 ctatgtgggg ggggaggcta gtattattac agcagattgg tttgctatat aaacaagtac 240 tttaaaaaat atttcttggg ccaggcgtgg tggctcacgc ctgtaatccc agcactttgg 300 gaggccgagg tgggcagatc acttgaggcc aagagttaag agaccagcct ggccaacatg 360 gtgaaacccc atctctacta aaaatataac aattagccag gcatggaggt gcatgcctgt 420 aattccagct gctcgagagg ctgaggcatg agaactgctg gatcctggga ggcagaggtt 480 gcagtgagct gatattgcgc cactgcactc catatccagc ctgggcaaca tggcaagact 540 ccgtctcaaa taaataaata aataaataaa taaaactaaa ggcagagttt tcttaaataa 600 acatggtagc cctcagcaac aatattgtaa gaactcctcg caagagaaaa agctggaata 660 agatactggc taagcaagta agaaaggcac tgccctgctt ctgcatacat tcaaactaag 720 acatatacat tgcagcttac acttacattt tccaatatcc ccaggcatcc ctttcccttc 780 tcaaacagcc aaaaggaacc agccatgcaa ataaaaatac aagttcaaga gcctaaaaga 840 agtcagtgtc ctaaaagaga aaattaatgt aaagaattaa gattttttga aactacactt 900 tctttctggg gctgtttact ggcctccaat acatcaatcc tgtaacactg tgaactacag 960 tgatagattg gtacatgctt ctaaacacaa cagaattttt ccaaggttac atacactgta 1020 acaaaagggg cattttgcag catcttattt tccttaatca actagtttgg atattctaac 1080 agtgcaaaca ttgtaaacaa taaattttca ttaccttttg aactttctga agtcaaccaa 1140 aggcttgtgg tatggatgca atgagtacta gacaggcaga gctgaatact agtcaaaata 1200 ttcagttact ggtgtgatag tccttttggg ggcatacatc acttagggag aaactgaggt 1260 gcaaggacat tttacacaca gcaaaaacat tctcaggaat ttgtcacatc attaccataa 1320 gccaaaaatc tcaaggtctt agaacagcct gagcttctga tcaaattata ttgtaaaaag 1380 agaggaaaaa aatgtgaagc gtgctatttt ttaaaataac agtaactact actactgctg 1440 ctgctgctaa ttctaaacgt ttactgagcc cttattatgt gccaagcacc gtgctaggta 1500 cggtcataga ttttaacaat taatccctgt aacaaccctc tgatattagt taataaaatt 1560 aaagtagaat cctcaccaaa aaaatttaaa ctttccaaat aaaaatataa ataaattatt 1620 aaagacattt cacctctttc tctgcctcag actacatttt caagtattaa atttacacta 1680 aaaccacatt tattttcagg aattccagtt aaagcgtaca gatattcaag atgttgacaa 1740 ttattacaga agaatcacag aactctgaaa ttaaatactg gcacagaaaa ccttccatcc 1800 aaccttacgg aacaactatc cccattttaa aaaaaaagga acagcatata tatcaggctt 1860 gataataaga ggcttctcat gcccacacta gcaatgaatg atgccataat tataaagaga 1920 cctgtatcgc cacatgcata aaaataattt acatctgcta agtcaagttt tcaatatatt 1980 attttgtgtg taaaccttat agtagctgat aaaaaataca ataaactaat ctaaggtaaa 2040 ctaaaacact aggttgtttc tgaagactca ctttagaatt tgagcagcat aataatcata 2100 atattagtaa tcaaactact tagcagaaag ttcttagagg gctgggaagc tgtgtataat 2160 aaaatggagc agacaagaag gaagggtttt ccgtactgtt taaatcaact acaggtccca 2220 gcatgcagtg ctctaatctg aagttaagca aaaactgcaa tgcatactgg gacttgtagt 2280 aagtaaacca cgttatcaca gcaagtttca agaaagtctg aactatctag cacaatttga 2340 ctatatctta ttatcagagt ctaatcaaat ttaaatcaaa tttgtatgtt ctctgatgtg 2400 gcacacagtt tctctagcac ataccggaaa aagtatcaat atttagacca acattttcac 2460 attagaaaaa tcttacgtag gagaagcaca gaaaaaaatg ctgaaaaagc aaaaaaactt 2520 gatgaataaa aaatataatt tttgaaatag ttttttaaag tttgaatgga tccatttcaa 2580 cattctctaa tcctccccca caaaaagttt aattgttttg gccgggcgcg gtggctcacg 2640 cctgtaatcc caacacttta ggaggctgag gcgggtgaat tacgagatca agagatcgag 2700 accatcctgg ccaacatggt gaaaccatct ctactaaaaa tacaaaaatt agttgggcgt 2760 ggtggcgcac gcctgtagtc ccagctactc aggaggctga gacaggagaa ttgcttgaac 2820 ctgggaggtg gaggctgcag tgagctaata tcgcaccact gcactccagc ctggtgacag 2880 tgtgagattc attctcaaaa aaaaaaaaaa aaaaagttta attgttttaa caggttgctt 2940 tttaacaatt attcaagatg tattttataa ataatttttc ttgaagaaaa ttctcagaag 3000 caaacattcc ccatattcta atattgccca ccaggaaata atttttttag taatacgcac 3060 acaccccatc acaaaaacaa acaaaaaaca ctgaagttct gcttttgtca agtccttact 3120 caatatttat gccctccatt cctcacctct aattccctac acacacacac acacacgcac 3180 acatccccac acacacacgc ttctacaaag aacacttaga aaaacagtat tccaactaca 3240 agcccacttc tctcatccac tgacctcttc tgaaaacaca aaagattttt taagctatca 3300 gtaacacgtc caaacacaag ctgataagtt tgagctagaa tttacatata tacagttgct 3360 acacaccctc ctattttctg caagtctgtg gaaggaggct gggaaagaac taagtgcaat 3420 ctgcatcagg aggcctaaca caggtggtgg gttattttca ggcaacagca ccttcacaaa 3480 catgttttgg aatatagtcc aagaaattcc taacaaggaa agataagctg gcacacaaat 3540 ttaacgcaat ccagctaaaa atcatctgca acacatgcta ctacatttca ccataaaagt 3600 gacgggctac tataaaggat ttgaagcttc gtcaatacaa catactgtcc ataaggccag 3660 agatagcagt tgccatggtt actataccca cttttatcag gaaattactg tcattacccc 3720 aaagttttgg gtacttattt aaaatttaaa aaaaacacac acaatttagg gttctgactg 3780 ttaattgagt gaaataatca actactgttt gatttgtaag tatgtcgctt tggagatgca 3840 catggttaac aatacttgga tctgcagcag aaaaaaaatc aattcctttc tgctgctcct 3900 tctcctcaag tactgacagt ttgtattctc aatgcagcca aaacaataaa acaaaaccca 3960 tctttttggc ttctgtgttt aagttatttt tcccctaggc ccacaaacag agtcaaaata 4020 aagcctagat catcaacctg ttaggcctca tccccttcct atcccctcca tactggttca 4080 ctttcttgac tacttagaaa aggcagaaaa catttctgta actgattcca aagtatagaa 4140 aagaatagtt gccttcaact gagatatttt caccaaagtc ttttttattt actttttttt 4200 taaggcaggg agaggggaga gacttgcagg gtactgaaag ggagaagtgg aggagtattc 4260 aaattgccac acaagtctag tgtaagaaag ttgctttaga agagtccaaa ggatggctga 4320 acctcacata taatttctaa aagctttgga agagttcacc ataattttaa gactgaattg 4380 agggacaagt aatagaaaag ttattcataa agtctacttc aacattttta caaaagataa 4440 ctattcaaaa atttaacaca catataagaa ttatacgaaa gcctacaaaa tagtatggcc 4500 acatatacac acaaacatac aaagtagaaa acataagcta tttaagaaat aattatctac 4560 aataaattca atgcaatgtt aacatattat ctctttttta aaaaatcgca aagcagcaaa 4620 aacatacacc tgagaaaatt aatgtgatca aaacgttaaa gaattcttag gcctataaaa 4680 aaagcccatg tacaaaagct cctgagaagt caacataaat cattaatatt tcccagcaca 4740 aaataatatg aaaattcaaa catgtttcaa gaaatcagtt ctagatatag atataaaaga 4800 attccattaa aggtcagaga cctaaaactt taattccttc ccttctctgt ttgaatagta 4860 attaaataca aaagccttca gcaataaaat actaaggata caaaatttaa aagcacatta 4920 atataagctt aacttcagta tgtcttcaca gaaagcttta ctattcactg tctgtaggat 4980 gaaaaagtta ataacaccct gagaggtttc atttttatct aaacagttaa gtgtttttct 5040 caccgttcac agaagcaagt ttctatattt actttctaaa gggggcaatt tcaaaagaat 5100 agtcacttct aaaatttaag atactatacc ttttgatagg ctcataaaca cagggttcct 5160 aattatctat attttacttt aaaatgtttc tattccaaat ttgtgagcag agtttataag 5220 aaagctgaaa ctcaaggctt taaacttttg ggttattttt acacaaaaat atttcagtgc 5280 actcctctag atttgagtag tcatttcctt gtgcatcctt ctaaaataga aaaacaaaaa 5340 tgatatatcc atatatacct aatactaaca catacagata tacatctttt tcactgtgaa 5400 acaagcttga aagctttagg cagtaagaat ttttcagaaa gttagcagag tcagtcaaaa 5460 cattcaaaac ttgaaccatg acatctgtta ctctgtcaat aagagtctat agaagaatca 5520 gggaacttac atactcacta aaatcaacta ctatcacatc acatcaatgg agaaatgaag 5580 aaaaactgta ataggggaca tacaattcac aggatcttca aaagggaaaa tgatcttttt 5640 ttttttttta aattatgaga aactgactag gcagcatttt ttcaaaagca gcttcaaaac 5700 tataacaaag acatttttgg taaccacagc agtatttaaa aaacaaaaat ttaggccggg 5760 cgtggtggct cacgcctata atcccagcac tttgggaggc caaggcaggt ggatcacctg 5820 agtcaggagt tcaagaccag cctgaccaac atggtgatac cccgtctcta ctcaaaatac 5880 aaaacttagc cgggcgtagt ggcggacacc tctataatca cagctactca ggaggctgag 5940 aggcaggaga atcgcttgaa cctgggaggc agaggttgca gtgagccgag atcacgccgt 6000 tgcactccag cctgggaaac agagcgagac tccgtctcaa aaaataaaaa aataaaaaaa 6060 ctatagtgtc cagggtgcac tttaaatgta ttactttctc aactgatatg gaaaaagtta 6120 gcatttaaag acagaagctt ctgtccatgt attaattagt tacctatctc aacaacttaa 6180 tatctgcatg ctttcttacc atttatgaag aacttttata tgtattatct catttggtct 6240 tactgagaaa acagtatttt gcctacaaaa tagacaaaat tcaaagcaga tttatcaaac 6300 tttctagcat ccccaaattt ttaaaacttc gacacaaaac tttacaagca accacagtgg 6360 catgatattt tcagtgataa tcaattcacc taacactaac agagtttcaa aggaccatgt 6420 gctataaatg ctatgaaact gttaaagtag ctatattcat ctttatgcag ttactgttac 6480 atcaacaatg acctaccact gatacaactt gacttacagt tcaagaatct cagtctttgc 6540 aggctaactt aagtacatca accatatgta tttataaagc cgagtgccta aaaattgatc 6600 tatattagaa tcatagtctg taaatccgag gggaaaaaac tacaagaagt ctaaaatttt 6660 ttcaacacac tatacccctt tccaaaatct caactactct atatcctatt tgtattaata 6720 ttatagggat gataacaagg cttaaagccc taaatcatac caactacttt tgtttataac 6780 aattacaaat aattttttaa aatacatgct caacatccca ctcatcaaca caagactaat 6840 tccccttcca aataaaataa ttctaaacag tgctctgtac caagggccag aatccttata 6900 ctatccgcaa tcgcacatct actttgtaca gtcaaagact tcactttcaa gtagcaaaca 6960 ttatttatga atggaatttt taaatggact tactcaaaat ctttctggaa ctttaaggtg 7020 ttaatcctgt tgcttagctg aagctaagca gagctgtaat aagtagcaag accctcaaaa 7080 ttcaaaaatt tcctttatct tgctgtagca cctcctgctg gatagcattt agagatcttc 7140 atgtaagcag aagaagagta tttcagaggc agctccttcc agaagactga ataggaaaaa 7200 ggatggaccc ttcaaagcta aaagaaatag gccccatcca tcacttatac cttctaaaaa 7260 tacaatttag cccaggtagg tgtctttttc atctattact actccagttc cacaaagact 7320 tgcctcagtc caaaatacaa catgcttaaa taaagcctgc aaaattgtct aaaaactaag 7380 ttaaaaagca ttcaatagca cccaagcaaa acactttatt atgggcagcc aagcaatgtc 7440 agtcaaactg taaatactat tatgttacca aaagcaaaag tctgatgtta aaaaaaaaaa 7500 aaaaaaagcc cctggaatat tcgtaacatg ttagccagat gtttgtgttt tgagaacttt 7560 gtgcactatt actatgctct tcacttaagg atagttgtac atctacaaac gttttaagta 7620 cagaaatttt tttataaaca ttagcataac tgtacacaaa atttcctctt tgccatgaaa 7680 agataggtcc tgggatttga aaatgtattt ttcagacatt tttaatgacc ccctaaaata 7740 aactagtttt aagcccacaa caccgattcc ataaacaagt aaagacagaa gaagagaata 7800 agaaggaact taccaaaatt aaaatgaata atagtatttc cagtaaaaat gtagtaacag 7860 tttccaacaa tgctgtaaac caaataaatt gtgaaactta aaaaaggaag gagggggcca 7920 gtcttcaaag accaaaagca aagctgacct atttatttct attgcttaga gtgaacacca 7980 gatgtaaaca aatatcataa acactgaaaa gtacgcttac atggtttagc ctcaatttca 8040 gtacccttac caggccctca ataaagctac agatgttggt gagaactcgc tcaaaaagga 8100 gataattcca gcccctcgcc ttaaagaatc cctatcaagt gaacctgtga aaagacttcc 8160 ttcccagagt gcacaactgc tttaaaaaaa aaaaactttc atcagcccaa attaatctga 8220 ttctaatatt caactatcca ttatttatat ataaatgttc ttccctctct aactttccca 8280 gctcgagcat ctacattcct gacaccgact attagcaaaa atgcacaact ccttccccag 8340 ctatggggca aatctttgaa atctgaaaca cagccacaaa gttcactgtc aaggccaggt 8400 gatgaggccc acacatgccc ggacctt 8427 〈210〉 15 〈211〉 1704 〈212〉 DNA 〈213〉人工序列 <220> 〈223>片段A 〈400〉 15 ggtaccaccc aagctggcta ggtaagcttg ctagcgccac catggtgctg cagacccagg 60 tgttcatctc cctgctgctg tggatctccg gcgcatatgg cgatatcgtg atgattaaac 120 gtacggtggc cgccccctcc gtgttcatct tccccccctc cgacgagcag ctgaagtccg 180 gcaccgcctc cgtggtgtgc ctgctgaata acttctaccc cagagaggcc aaggtgcagt 240 ggaaggtgga caacgccctg cagtccggga actcccagga gagcgtgacc gagcaggaca 300 gcaaggacag cacctacagc ctgagcagca ccctgaccct gagcaaagcc gactacgaga 360 agcacaaggt gtacgcctgc gaggtgaccc accagggcct gagctccccc gtcaccaaga 420 gcttcaacag gggggagtgt taggggcccg tttaaacggg tggcatccct gtgacccctc 480 cccagtgcct ctcctggccc tggaagttgc cactccagtg cccaccagcc ttgtcctaat 540 aaaattaagt tgcatcattt tgtctgacta ggtgtccttc tataatatta tggggtggag 600 gggggtggta tggagcaagg ggcaagttgg gaagacaacc tgtagggcct gcggggtcta 660 ttgggaacca agctggagtg cagtggcaca atcttggctc actgcaatct ccgcctcctg 720 ggttcaagcg attctcctgc ctcagcctcc cgagttgttg ggattccagg catgcatgac 780 caggctcacc taatttttgt ttttttggta gagacggggt ttcaccatat tggccaggct 840 ggtctccaac tcctaatctc aggtgatcta cccaccttgg cctcccaaat tgctgggatt 900 acaggcgtga accactgctc cacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 960 tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 1020 tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 1080 tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 1140 gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 1200 agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 1260 cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 1320 agctgattta acaaaaattt aacgcgaatt aattctgtgg aatgtgtgtc agttagggtg 1380 tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc 1440 agcaaccagg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca 1500 tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 1560 gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 1620 cgaggccgcc tctgcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 1680 aggcttttgc aaaaagctcc cggg 1704 <210> 16 〈211〉 1120 〈212〉 DNA 〈213〉人工序列 <220> 〈223>人IgGl信號+人IgGl恒定區(qū) <400> 16 tgctagcgcc accatgaaac acctgtggtt cttcctcctg ctggtggcag ctcccagatg 60 ggtgctgagc caggtgcaat tgtgcaggcg gttagctcag cctccaccaa gggcccaagc 120 gtcttccccc tggcaccctc ctccaagagc acctctggcg gcacagccgc cctgggctgc 180 ctggtcaagg actacttccc cgaacccgtg accgtgagct ggaactcagg cgccctgacc 240 agcggcgtgc acaccttccc cgctgtcctg cagtcctcag gactctactc cctcagcagc 300 gtggtgaccg tgccctccag cagcttgggc acccagacct acatctgcaa cgtgaatcac 360 aagcccagca acaccaaggt ggacaagaga gttgagccca aatcttgtga caaaactcac 420 acatgcccac cctgcccagc acctgaactc ctggggggac cctcagtctt cctcttcccc 480 ccaaaaccca aggacaccct catgatctcc cggacccctg aggtcacatg cgtggtggtg 540 gacgtgagcc acgaagaccc tgaggtcaag ttcaactggt acgtggacgg cgtggaggtg 600 cataatgcca agacaaagcc ccgggaggag cagtacaaca gcacgtaccg ggtggtcagc 660 gtcctcaccg tcctgcacca ggactggctg aatggcaagg agtacaagtg caaggtctcc 720 aacaaagccc tcccagcccc catcgagaaa accatctcca aagccaaagg ccagccccgg 780 gaaccacagg tgtacaccct gcccccatcc cgggaggaga tgaccaagaa ccaggtcagc 840 ctgacctgcc tggtcaaagg cttctatccc agcgacatcg ccgtggagtg ggagagcaat 900 ggccagcccg agaacaacta caagaccacc cctcccgtgc tggactccga cggctccttc 960 ttcctctaca gcaagctcac cgtggacaag agcaggtggc agcagggcaa cgtcttctca 1020 tgctccgtga tgcatgaggc tctgcacaac cactacaccc agaagagcct ctccctgtct 1080
【權(quán)利要求】
1. 多核苷酸,其包含由序列表中SEQ ID NO: 1所示的核苷酸序列。
2. 多核苷酸,其包含由序列表中SEQ ID NO: 2所示的核苷酸序列。
3. 多核苷酸,其包含由序列表中SEQ ID NO: 3所示的核苷酸序列。
4. 多核苷酸,其包含與根據(jù)權(quán)利要求1至3任一項的多核苷酸的核苷酸序列具有95% 或更高同一性的核苷酸序列并具有啟動子活性。
5. 多核苷酸,其包含與根據(jù)權(quán)利要求1至3任一項的多核苷酸的核苷酸序列具有99% 或更高同一性的核苷酸序列并具有啟動子活性。
6. 多核苷酸,其在嚴格條件下與包含與根據(jù)權(quán)利要求1至3任一項的多核苷酸的核苷 酸序列互補的核苷酸序列的多核苷酸雜交,并具有啟動子活性。
7. 外源基因表達單元,其包含根據(jù)權(quán)利要求1至6任一項的多核苷酸。
8. 根據(jù)權(quán)利要求7的外源基因表達單元,其中所述外源基因是編碼多聚體蛋白的基 因。
9. 根據(jù)權(quán)利要求7的外源基因表達單元,其中所述外源基因是編碼異源多聚體蛋白的 基因。
10. 根據(jù)權(quán)利要求7的外源基因表達單元,其中所述外源基因是編碼抗體或其功能片 段的基因。
11. 外源基因表達載體,其包含根據(jù)權(quán)利要求7至10任一項的外源基因表達單元。
12. 外源基因表達載體,其包含根據(jù)權(quán)利要求7至10任一項的外源基因表達單元和一 種或多種選自下列組A中(1)至(9)所述的多核苷酸: 組A (1) 包含由序列表中SEQ ID NO: 10所示的核苷酸序列的多核苷酸; (2) 包含由序列表中SEQ ID NO: 11所示的核苷酸序列的多核苷酸; (3) 包含由序列表中SEQ ID NO: 12所示的核苷酸序列的多核苷酸; (4) 包含由序列表中SEQ ID NO: 13所示的核苷酸序列的多核苷酸; (5) 包含由序列表中SEQ ID NO: 14所不的核苷酸序列的多核苷酸; (6) 包含由序列表中SEQ ID NO: 10至14任一所表示的核苷酸序列的至少3000個連續(xù) 核苷酸的多核苷酸; (7) 包含由序列表中SEQ ID NO: 10至14任一所表示的核苷酸序列的至少2000個連續(xù) 核苷酸的多核苷酸; (8) 包含與根據(jù)上述(1)至(7)任一項的多核苷酸的核苷酸序列具有95%或更高同一 性的多核苷酸序列并具有增強外源基因表達的活性的多核苷酸;和 (9) 包含與根據(jù)上述(1)至(7)任一項的多核苷酸的核苷酸序列具有99%或更高同一 性的核苷酸序列并具有增強外源基因表達的活性的多核苷酸。
13. 轉(zhuǎn)化的細胞,其已經(jīng)導入根據(jù)權(quán)利要求11或12的外源基因表達載體。
14. 轉(zhuǎn)化的細胞,其已經(jīng)導入根據(jù)權(quán)利要求11或12的外源基因表達載體和元件載體。
15. 根據(jù)權(quán)利要求13或14的轉(zhuǎn)化的細胞,其中所述細胞是衍生自哺乳動物的培養(yǎng)的細 胞。
16. 根據(jù)權(quán)利要求15的轉(zhuǎn)化的細胞,其中所述衍生自哺乳動物的培養(yǎng)的細胞是C0S-1 細胞、293細胞或CH0細胞。
17. 生產(chǎn)蛋白的方法,其特征在于包括培養(yǎng)根據(jù)權(quán)利要求13至16任一項的轉(zhuǎn)化的細胞 并從所得的培養(yǎng)產(chǎn)物中獲得衍生自外源基因的蛋白。
18. 根據(jù)權(quán)利要求1至6任一項的多核苷酸用于在轉(zhuǎn)化細胞中表達外源基因的用途。
19. 根據(jù)權(quán)利要求11至12的外源基因表達載體用于在轉(zhuǎn)化的細胞中表達外源基因的 用途。
【文檔編號】C12N15/09GK104066839SQ201280068236
【公開日】2014年9月24日 申請日期:2012年11月27日 優(yōu)先權(quán)日:2011年11月28日
【發(fā)明者】村上賢二 申請人:第一三共株式會社