表達盒的制作方法
【專利摘要】本發(fā)明涉及用于表達編碼多肽的多核苷酸序列的表達盒。
【專利說明】表達盒
[0001] 相關申請
[0002] 本申請要求2011年12月7日遞交的US臨時申請?zhí)?1/567, 675的權益;所有這 些通過引用以其整體并入本文。 發(fā)明領域
[0003] 本發(fā)明涉及用于表達編碼多肽的多核苷酸序列的表達盒。本發(fā)明是還涉及包含表 達盒的載體和宿主細胞以及表達盒用于從宿主細胞產(chǎn)生多肽的用途。 【背景技術】
[0004] 用于產(chǎn)生重組多肽的表達系統(tǒng)是現(xiàn)有技術中熟知的并且由例如,Marino ΜΗ(1989) Biopharm, 2:18-33 ;Goeddel DV 等人,(1990)Methods Enzymol 185:3-7 ;Wurm F 和 Bernard A(1999)Curr Opin Biotechnol 10:156-159 描述。用于藥物應用中的多膚優(yōu) 選地在哺乳動物細胞如CH0細胞、NS0細胞、SP2/0細胞、COS細胞、HEK細胞、BHK細胞等中 產(chǎn)生。用于此目的的表達載體的必需元件通常選自包含原核復制起點和原核選擇標記,任 選地真核選擇標記的原核質(zhì)粒增殖單元,例如大腸桿菌(E. coli),和用于表達一個或多個 目的結(jié)構基因的一個或多個表達盒,所述表達盒每一者包含啟動子、編碼多肽的多核苷酸 序列和任選地轉(zhuǎn)錄終止子,所述轉(zhuǎn)錄終止子包含多聚腺苷化信號。為了在哺乳動物細胞中 瞬時表達,可以包括哺乳動物復制起點,如SV400ri或OriP。作為啟動子,可以選擇組成型 或誘導型啟動子。為了優(yōu)化的轉(zhuǎn)錄,可以在5'非翻譯區(qū)中包含Kozak序列。為了 mRNA加 工,尤其mRNA剪接和轉(zhuǎn)錄終止,取決于結(jié)構基因的組織狀況(外顯子/內(nèi)含子組織狀況), 可以包括mRNA剪接信號,以及多聚腺苷化信號。基因的表達以瞬時方式或使用穩(wěn)定的細胞 系進行。生產(chǎn)細胞系中多肽的穩(wěn)定和高度表達的水平對于產(chǎn)生重組多肽的整個過程至關重 要。在過去數(shù)年間,對生物分子如蛋白質(zhì)并且特別對抗體或抗體片段的需求已經(jīng)顯著地增 力口。高成本和不良產(chǎn)率已經(jīng)是生物分子可用性方面的限制因素并且它已經(jīng)成為發(fā)展以工業(yè) 規(guī)模增加所需生物分子的產(chǎn)量的穩(wěn)健工藝的主要挑戰(zhàn)。因而仍需要改善表達載體的效率以 在重組多肽生產(chǎn)中實現(xiàn)高表達。
[0005] 發(fā)明簡述
[0006] 本發(fā)明一般地涉及可以用來在重組多肽生產(chǎn)中實現(xiàn)表達增加的表達系統(tǒng)如表達 盒和表達載體。在一個方面,本公開提供表達盒,其包含啟動子、編碼多肽的多核苷酸序列 和真核甘油醛3-磷酸脫氫酶(GAPDH)啟動子下游的非翻譯性基因組DNA序列,其中由多核 苷酸序列編碼的多肽不是GAPDH,并且其中真核GAPDH啟動子下游的非翻譯性基因組DNA序 列始于跨越從核苷酸位置約+1至核苷酸位置約+7000的區(qū)域內(nèi)部,其中核苷酸位置是相對 于GAPDH mRNA轉(zhuǎn)錄起始的,并且其中真核GAPDH啟動子下游的非翻譯性基因組DNA序列的 長度是約100至約15000個核苷酸。
[0007] 在又一個方面,本公開提供表達盒,其包含啟動子、編碼多肽的多核苷酸序列和 真核GAPDH啟動子上游的非翻譯性基因組DNA序列,其中由多核苷酸序列編碼的多肽不 是GAPDH,并且其中真核GAPDH啟動子上游的非翻譯性基因組DNA序列始于跨越大約真核 GAPDH啟動子的5'末端至核苷酸位置約-3500的區(qū)域內(nèi)部,其中核苷酸位置是相對于GAPDH mRNA轉(zhuǎn)錄起始的,其中真核GAPDH啟動子上游的非翻譯性基因組DNA序列的長度是100至 約15000個核苷酸,條件是表達盒不包含真核GAPDH啟動子或其片段。
[0008] 在又一個方面,本公開提供包含表達盒的表達載體和包含表達盒或表達載體的宿 主細胞,其中所述表達載體包含表達盒。
[0009] 在其他方面,本公開提供一種用于表達多肽的體外方法,所述方法包括用表達盒 或表達載體轉(zhuǎn)染宿主細胞并回收多肽,和表達盒或表達載體用于從哺乳動物宿主細胞表達 異源多肽的用途。
[0010] 附圖簡述
[0011] 圖1顯示報道基因表達構建體(REP),其由小鼠巨細胞病毒啟動子(mCMV)、含有第 一內(nèi)含子的Ig供體接納體片段(IgDA)、IgGl抗體輕鏈(IgGlLC)、源自腦心肌炎病毒的內(nèi)部 核糖體進入位點(IRES)、IgGl抗體重鏈(IgGlHC)、綠色熒光蛋白(GFP)和猿猴病毒40多 聚腺苷化信號(poly(A))組成。
[0012] 圖2顯示在轉(zhuǎn)染后第5日IgGl抗體在CH0-S細胞中的瞬時表達(將IgG滴度的均 值對兩次獨立轉(zhuǎn)染作圖)。使用GAPDH_A和GAPDH_B載體(GAPDH_A和GAPDH_B)、無 GAPDH 上游元件和下游元件的相同載體(A和B)和作為對照的pGLEX41載體(pGLEX41),轉(zhuǎn)染細 胞。使用Octet儀器(Fortebio, Menlo, CA,美國)確定上清液中積累的IgGl抗體的濃度。
[0013] 圖3顯示IgGl抗體在HEK293EBNA細胞中的表達。使用GAPDH_A和GAPDH_B載體 和作為對照的pGLEX41載體(pGLEX41),轉(zhuǎn)染細胞。將上清液收獲并 在轉(zhuǎn)染后第10日使用Octet儀器分析。數(shù)據(jù)代表每個載體在旋轉(zhuǎn)管(tubespin)中的N = 3個獨立轉(zhuǎn)染。
[0014] 圖4顯示使用細胞匯集物在分批生產(chǎn)時的表達水平研究。使用GAPDH_A和GAPDH_ B 載體(GAPDH_A (1)、GAPDH_A (2)、GAPDH_B ⑴和 GAPDH_B (2))、無 GAPDH 上游元件和下游元 件的相同載體(A(l)和A(2))和作為對照的pGLEX41載體(pGLEX41),轉(zhuǎn)染細胞并且產(chǎn)生穩(wěn) 定細胞的匯集物。在7日培養(yǎng)后,使用Octet儀器對上清液分析上清液中積累的抗體。給 出每種匯集物的IgG滴度均值(μ g/ml)。數(shù)據(jù)代表每種匯集物N = 2個批次。
[0015] 圖5顯示在通過穩(wěn)定轉(zhuǎn)染和有限稀釋法產(chǎn)生的群體上的表達水平研究。使用 GAPDH_A和GAPDH_B載體(GAPDH_A和GAPDH_B)、無 GAPDH上游元件和下游元件的相同載體 (A和B)和作為對照的pGLEX41載體(pGLEX41),轉(zhuǎn)染細胞。在轉(zhuǎn)染后14日讀取來自穩(wěn)定 轉(zhuǎn)染的克隆和小量匯集物所表達的GFP熒光的均值。將細胞在96孔板中選擇壓力下培育。 數(shù)據(jù)代表每種載體N = 48個克隆或小量匯集物。
[0016] 圖6顯示培養(yǎng)基添加物胰島素和PMA(佛波醇12-肉豆蘧酸酯13-乙酸酯,一種 佛波醇酯)對上清液中IgGl抗體表達的影響。用GAPDH_A載體(GAPDH_A)和作為對照的 PGLEX41載體(pGLEX41)轉(zhuǎn)染后,將細胞稀釋于PowerCH02培養(yǎng)基、4mM Gin、+/-胰島素和 PowerCH02、4mM Gln、PMA+/_胰島素中。與標準培養(yǎng)基相比,對pGLEX41(實心棒)或GAPDH_ A (空心棒)沒有觀察到表達差異。
[0017] 圖7顯示人GAPDH基因座的概覽。GAPDH基因側(cè)翼為基因 NCAPD2和IFF01。
[0018] 圖8顯示人GAPDH基因、GAPDH上游元件和下游元件和為分析GAPDH上游片段化 研究所產(chǎn)生的片段的細節(jié)。引入Nrul限制性位點以促進克隆步驟并且該位點不是基因 組5'GAPDH上游序列的部分(因此使用星號突出顯示它)。片段的大小是:片段1(SEQ ID N0:9):511bp、片段 2(SEQ ID N0:10):2653bp、片段 3(SEQ ID N0:ll):1966bp、片段 4(SEQ ID N0:12):1198bp、片段 8(SEQ ID N0:13):259bp、片段 9(SEQ ID N0:14):1947bp、片段 11(SEQ ID N0:15):1436bp 和片段 17(SEQ ID N0:16):1177bp。
[0019] 圖9顯示GAPDH上游元件和下游元件片段化的表達結(jié)果。在轉(zhuǎn)染后第10日在CHO 細胞中以瞬時轉(zhuǎn)染方式獲得表達結(jié)果。使用Octet儀器進行定量。載體pGLEX41充當陰性對 照。pGLEX41-ampiA還是顯示無 GAPDH側(cè)翼元件的載體基礎表達的陰性對照。pGLEX41-上 /下含有全長側(cè)翼區(qū)(上游區(qū)和下游區(qū))并充當陽性對照。PGLEX41-上僅含有上游側(cè)翼區(qū) 并且PGLEX41-下僅含有下游側(cè)翼區(qū)。全部其他構建體均含有圖8中描述的片段。片段2 和片段3按照與IgGILC和IgGlHC相同的方向克隆或相對于IgGILC和IgGlHC(AS)以相反 方向克隆。
[0020] 圖10顯示在轉(zhuǎn)染后第8日IgGl抗體在CH0-S細胞中的瞬時表達(將IgG滴度 的均值對三次獨立轉(zhuǎn)染作圖;誤差條:SD+/-)。使用具有中國倉鼠 GAPDH上游元件與小鼠 CMV(A_GAPDH_UP)或中國倉鼠 GAPDH啟動子(A_GAPDH_UP_PR)組合的載體,轉(zhuǎn)染細胞。轉(zhuǎn)染 僅具有小鼠 CMV(A)或中國倉鼠 GAPDH啟動子(A_PR)的質(zhì)粒作為對照。使用Octet QK儀 器(Fortebio, Menlo, CA,美國)確定上清液中積累的IgGl抗體的濃度。
[0021] 發(fā)明詳述
[0022] 本公開涉及表達盒和表達載體,所述表達盒和表達載體包含啟動子、編碼多肽的 多核苷酸序列和真核甘油醛3-磷酸脫氫酶(GAPDH)啟動子下游的非翻譯性基因組DNA序 列,其中由多核苷酸序列編碼的多肽不是GAPDH,并且其中真核GAPDH啟動子下游的非翻譯 性基因組DNA序列始于跨越核苷酸位置約+1至核苷酸位置約+7000的區(qū)域內(nèi)部,其中核苷 酸位置是相對于GAPDH mRNA轉(zhuǎn)錄起始的,并且其中真核GAPDH啟動子下游的非翻譯性基因 組DNA序列的長度是約100至約15000個核苷酸。
[0023] 本公開還涉及一種表達盒,其包含啟動子、編碼多肽的多核苷酸序列和真核GAPDH 啟動子上游的非翻譯性基因組DNA序列,其中由多核苷酸序列編碼的多肽不是GAPDH,并且 其中真核GAPDH啟動子上游的非翻譯性基因組DNA序列始于跨越大約真核GAPDH啟動子的 5'末端至核苷酸位置約-3500的區(qū)域內(nèi)部,其中核苷酸位置是相對于GAPDH mRNA轉(zhuǎn)錄起始 的,其中真核GAPDH啟動子上游的非翻譯性基因組DNA序列的長度是100至約15000個核 苷酸,條件是表達盒不包含真核GAPDH啟動子或其片段。
[0024] 如本文所用的術語"表達盒"包含多核苷酸序列,所述多核苷酸序列編碼待表達的 多肽和控制其表達的序列如啟動子以及任選地增強子序列,包括順式作用轉(zhuǎn)錄性控制單元 的任何組合??刂苹虮磉_(即其轉(zhuǎn)錄和轉(zhuǎn)錄產(chǎn)物翻譯)的序列常稱作調(diào)節(jié)單元。調(diào)節(jié)單 元的大多數(shù)部分位于基因的編碼序列上游并與之有效連接。表達盒也可以含有包含多聚腺 苷化位點的下游3'非翻譯區(qū)。本發(fā)明的調(diào)節(jié)單元與待表達的基因即轉(zhuǎn)錄單位有效連接,或 由間插DNA例如異源基因的5' -非翻譯區(qū)分隔。優(yōu)選地,表達盒側(cè)翼為一種或多種合適的 限制性位點以便可以將表達盒插入載體中和/或?qū)⑵鋸妮d體切除。因而,本發(fā)明的表達盒 可以用于構建表達載體,尤其哺乳動物表達載體。本發(fā)明的表達盒可以包含一個或多個例 如兩個、三個或甚至更多個在真核GAPDH啟動子或其片段下游的非翻譯性基因組DNA序列, 和/或一個或多個例如兩個、三個或甚至更多個在真核GAPDH啟動子或其片段上游的非翻 譯性基因組DNA序列。如果本發(fā)明的表達盒包含多于一個在真核GAPDH啟動子或其片段下 游和/或上游的DNA序列,則這些DNA序列可以是直接連接的,即可以包含接頭序列,例如 含有與5'末端和3'末端連接并允許輕易依次克隆所述序列或其片段的限制性位點的接頭 序列。備選地,真核GAPDH啟動子或其片段下游和/或上游的DNA序列可以不是直接連接 的,即可以隨間插DNA序列一起克隆。
[0025] 如本文所用的術語"編碼多肽的多核苷酸序列"包括編碼表達所述多肽的基因、優(yōu) 選地異源基因的DNA。
[0026] 術語"異源編碼序列"、"異源基因序列"、"異源基因"、"重組基因"或"基因"互換使 用。這些術語指這樣的DNA序列,所述DNA序列編碼設法在宿主細胞中、優(yōu)選地在哺乳動物 細胞中表達并收獲的重組蛋白產(chǎn)物,尤其重組異源蛋白產(chǎn)物?;虻漠a(chǎn)物可以是多肽。異 源基因序列天然地不存在于宿主細胞中并且源自相同或不同物種的生物并且可以是基因 修飾的。
[0027] 術語"蛋白質(zhì)"和"多肽"互換地用來包括通過相鄰殘基的α -氨基和羧基之間的 肽鍵彼此連接的一串氨基酸殘基。
[0028] 如本文所用的術語"非翻譯性基因組DNA序列"包括構成生物的遺傳信息的DNA。 幾乎全部生物的基因組是DNA,唯一例外是具有RNA基因組的一些病毒。大多數(shù)生物中的 基因組DNA分子被組織成稱作染色體的DNA-蛋白質(zhì)復合體。染色體的大小、數(shù)目和基因組 DNA的性質(zhì)在不同生物之間不同。病毒DNA基因組可以是單鏈或雙鏈、線型或環(huán)狀的。全部 其他生物具有雙鏈DNA基因組。細菌具有單個環(huán)狀染色體。在真核生物中,大多數(shù)基因組 DNA作為大小不同的多條線形染色體位于核內(nèi)(核DNA)。真核細胞額外地在線粒體中含有 基因組DNA,并且在植物和低等真核生物中,在葉綠體中含有基因組DNA。這種DNA通常是 環(huán)狀分子并且在這些細胞器內(nèi)部作為多個副本存在。非翻譯性基因組DNA序列通常不與啟 動子有效連接并且因此不翻譯。它可以含有不翻譯的基因,因此含有編碼例如不表達的蛋 白質(zhì)的基因。
[0029] 如本文所用的術語"真核GAPDH啟動子下游的非翻譯性基因組DNA序列"對應于真 核GAPDH啟動子3'的非翻譯性真核基因組DNA。真核GAPDH啟動子下游的非翻譯性基因組 DNA序列通常在核苷酸位置約+1處,優(yōu)選地在核苷酸位置+1處開始,其中核苷酸位置是相 對于GAPDH mRNA轉(zhuǎn)錄起始的,即相對于編碼GAPDH的真核基因的轉(zhuǎn)錄起始(transcription start)的起點(origin)。真核GAPDH啟動子下游的非翻譯性基因組DNA序列通常具有與 真核GAPDH啟動子相同的來源,例如,如果該GAPDH啟動子是人源的,則人GAPDH啟動子下 游的非翻譯性基因組DNA序列也是人源的并對應于人GAPDH啟動子下游天然存在的人類基 因組DNA序列。
[0030] 如本文所用的術語"真核GAPDH啟動子上游的非翻譯性基因組DNA序列"對應于 真核GAPDH啟動子5'的非翻譯性真核基因組DNA。真核GAPDH啟動子上游的非翻譯性基 因組DNA序列通常在約真核GAPDH啟動子的5'末端處的核苷酸位置處,優(yōu)選地在緊鄰真核 GAPDH啟動子5'末端之后的核苷酸位置處開始。真核GAPDH啟動子上游的非翻譯性基因組 DNA序列通常具有與真核GAPDH啟動子相同的來源,例如,如果該GAPDH啟動子是人源的,則 人GAPDH啟動子上游的非翻譯性基因組DNA序列也是人源的并對應于人GAPDH啟動子上游 天然存在的人類基因組DNA序列。
[0031] 如非另外具體說明,則真核GAPDH啟動子、真核GAPDH啟動子下游或上游的非翻譯 性基因組DNA序列和如本文中所示的其他DNA序列的位置是相對于GAPDH mRNA轉(zhuǎn)錄起始 的,例如是相對于真核GAPDH的轉(zhuǎn)錄起始的起點的。
[0032] 術語"真核GAPDH啟動子上游的非翻譯性基因組DNA序列延伸至"或"真核GAPDH 啟動子下游的非翻譯性基因組DNA序列延伸至"用來限定真核GAPDH啟動子上游和/或下 游的非翻譯性基因組DNA序列的長度從起始至特定遺傳元件的長度的延伸,例如至內(nèi)含子 的延伸。這種延伸包括編碼該遺傳元件例如內(nèi)含子或其部份的DNA序列的全長。
[0033] 人、大鼠和小鼠的真核GAPDH啟動子和GAPDH啟動子上游和/或下游的真核基因 組DNA可以在NCBI公共數(shù)據(jù)庫中找到(人、小鼠、大鼠和中國倉鼠 GAPDH基因的條目分別是 基因 ID 2597(mRNA:NM_002046. 3)、14433(mRMA:NM_008084. 2)、24383(mRNA:NM_017008. 3) 和 100736557 (mRNA:NM_001244854. 2 ;美國國家生物技術信息中心(NCBI) :http://www. ncbi. nlm. nih. gov/)并且示意地在圖7和8中針對人GAPDH基因顯示。
[0034] 通常認為真核GAPDH啟動子相對于GAPDH mRNA轉(zhuǎn)錄起始從約bps-500伸展至約 +50。人GAPDH啟動子位于第12號染色體上?;谄位芯浚珿raven等人(Graven等 人,(1999) Biochimica et Biophysics Acta, 147:203-218)認為人 GAPDH 啟動子相對于 GAPDH mRNA轉(zhuǎn)錄起始從bps-488伸展至+20。根據(jù)NCBI公共數(shù)據(jù)庫,人GAPDH啟動子相對 于如NCBI公共數(shù)據(jù)庫所定義的GAPDH mRNA轉(zhuǎn)錄起始從bps-462伸展至+46。如非另外具 體說明,如本文提到的人GAPDH啟動子相對于GAPDH mRNA轉(zhuǎn)錄起始從位置-462伸展至位 置+46,這對應于從SEQ ID N0:17的bps 4071伸展至4578的序列。
[0035] 如本文中提到的針對人、小鼠和大鼠源GAPDH基因、IFF01基因和NCAPD2基因的 DNA所用的編號對應于NCBI公共數(shù)據(jù)庫中針對這些基因所用的編號(http://www. ncbi. nlm. nih. gov/) 〇
[0036] 如本文所用的術語"啟動子"限定一般位于基因上游的調(diào)節(jié)性DNA序列,所述調(diào)節(jié) 性DNA序列通過指導RNA聚合酶與DNA結(jié)合并啟動RNA合成介導轉(zhuǎn)錄的起始。
[0037] 如本文所用的術語"增強子"限定一種核苷酸序列,該核苷酸序列作用為使激動基 因轉(zhuǎn)錄成為可能,所述基因轉(zhuǎn)錄與基因的身份、該序列相對于基因的位置或序列的取向無 關。本發(fā)明的載體任選地包含增強子。
[0038] 術語"功能性連接"和"有效連接"互換使用并且指兩個或更多個DNA區(qū)段、尤其 待表達基因序列和控制其表達的那些序列之間的功能關系。例如,如果啟動子和/或增強 子序列(包括順式作用轉(zhuǎn)錄性控制元件的任何組合)在適宜的宿主細胞或其他表達系統(tǒng)中 刺激或調(diào)節(jié)編碼序列的轉(zhuǎn)錄,則它與編碼序列有效連接。與轉(zhuǎn)錄的基因序列有效連接的啟 動子調(diào)節(jié)序列是在物理上與轉(zhuǎn)錄的序列鄰接的。
[0039] "取向"指給定DNA序列中的核苷酸順序。例如,DNA序列相對于另一個DNA序列以 相反方向的取向是這種情況,其中與從其中獲得該序列的DNA中的參照點相比時,該序列 相對于另一個序列的5'至3'順序反轉(zhuǎn)。這類參考點可以包括源DNA中轉(zhuǎn)錄其他指定DNA 序列的方向和/或含有該序列的復制型載體的復制起點。
[0040] 如本文所用的術語"表達載體"包括分離和純化的DNA分子,所述分子在轉(zhuǎn)染入適 宜的宿主細胞時在宿主細胞內(nèi)部提供重組基因產(chǎn)物的高水平表達。除編碼重組或基因產(chǎn)物 的DNA序列之外,表達載體還包含宿主細胞系中將DNA編碼序列有效轉(zhuǎn)錄成mRNA并將mRNA 有效翻譯成蛋白質(zhì)所需要的調(diào)節(jié)性DNA序列。
[0041] 如本文所用的術語"宿主細胞"或"宿主細胞系"包括能夠在培養(yǎng)物中生長并表達 所需重組產(chǎn)物蛋白質(zhì)的任何細胞、尤其哺乳動物細胞。
[0042] 如本文所用的術語"片段"包括相應核苷酸序列的一部分,例如真核GAPDH啟動子 下游和/或上游的非翻譯性基因組DNA序列的一部分或編碼特定遺傳元件(如啟動子)的 核苷酸序列的一部分。真核GAPDH啟動子下游和/或上游的非翻譯性基因組DNA序列的片 段可以保留生物活性并因此改變(例如增加)與啟動子有效連接的編碼序列的表達模式。 真核GAPDH啟動子下游和/或上游的非翻譯性基因組DNA序列的片段范圍從至少約100至 約3000bp、優(yōu)選地從約200至約2800bp、更優(yōu)選地從約300至約2000bp核苷酸、尤其從約 500至約1500bp核苷酸。為了在本發(fā)明的表達盒中克隆真核GAPDH啟動子下游和/或上游 的非翻譯性基因組DNA序列的片段,通常將含有允許便利克隆的限制性位點的接頭序列與 所述片段的5'末端和3'末端連接。
[〇〇43] 如本文所用的術語"核苷酸序列同一性"或"相同核苷酸序列"包括在比對序列并 引入空位(如果需要)以實現(xiàn)最大序列同一性百分數(shù)后,候選序列中與例如真核GAPDH啟 動子下游和/或上游的非翻譯性基因組DNA序列的核苷酸序列相同的核苷酸的百分數(shù)。因 此,可以通過常用來比較兩個核苷酸序列的核苷酸位置中相似性的標準方法確定序列同一 性。通常,相對于真核GAPDH啟動子下游和/或上游的非翻譯性基因組DNA序列,候選序列 的核苷酸序列同一性是至少80%、優(yōu)選地至少85%、更優(yōu)選地至少90%并且最優(yōu)選地是至 少95 %、尤其96 %,更特別地是97 %,甚至更特別地是98 %、最特別地是99 %,包括例如, 80 %,81 %,82 %,83 %,84 %,85 %,86 %,87 %,88 %,89 %,90 %,91 %,92 %,93 %,94 %, 95%、96%、97%、98%、99%和100%。
[0044] 如本文所用的術語"CpG位點"包括其中胞嘧啶核苷酸在線性堿基序列中沿其長度 緊鄰鳥嘌呤核苷酸出現(xiàn)的DNA區(qū)域。"CpG"是"-C-磷酸酯-G-"的速記,S卩,由僅一個磷酸 酯分隔的胞嘧啶和鳥嘌呤;磷酸酯將DNA中的任何兩個核苷連接在一起。"CpG"記號用來 區(qū)分這種線性序列與胞嘧啶和鳥嘌呤的CG堿基配對。
[0045] 如本文所用的術語"備選密碼子選擇"包括使用編碼相同氨基酸的備選密碼子以 避免CpG序列基序。這包括優(yōu)選地使用不具有內(nèi)部CpG位點的密碼子(例如編碼丙氨酸并 含有CpG位點的GCG,可由GCT、GCC或GCA替換)以及避免產(chǎn)生新CpG位點的兩個密碼子 連接。
[0046] 在涉及DNA序列長度和涉及相對于GAPDH mRNA轉(zhuǎn)錄起始例如相對于真核GAPDH 轉(zhuǎn)錄起始起點的核苷酸位置時,本文所用的術語"約"包括偏離所述值最多± 50 %、通常最 多± 10%的值,例如"約3000個核苷酸"包括2700至3300個核苷酸、優(yōu)選地2900至3100 個核苷酸、更優(yōu)選地2995至3005個核苷酸的值,"約100個核苷酸"包括50至150個核苷 酸、優(yōu)選地90至110個核苷酸、更優(yōu)選地95至105個核苷酸的值,"約15000個核苷酸"包 括13500至16500個核苷酸、優(yōu)選地14500至15500個核苷酸、更優(yōu)選地14990至15010個 核苷酸、最優(yōu)選地14995至15005個核苷酸的值,"約200個核苷酸"包括150至250個核 苷酸、優(yōu)選地190至210個核苷酸、更優(yōu)選地195至205個核苷酸的值,"約8000個核苷酸" 包括7200至8800、優(yōu)選地7500至8500個核苷酸、更優(yōu)選地7990至8010個核苷酸、最優(yōu) 選地7995至8005個核苷酸的值,"約500個核苷酸"包括450至550個核苷酸、優(yōu)選地475 至525、更優(yōu)選地490至510、最優(yōu)選地495至505個核苷酸的值,"約5000個核苷酸"包括 4500至5500個核苷酸、優(yōu)選地4750至5250、更優(yōu)選地4990至5010、最優(yōu)選地4995至5005 個核苷酸的值,"約1000個核苷酸"包括900至1100個核苷酸、優(yōu)選地950至1050、更優(yōu)選 地990至1010、最優(yōu)選地995至1005個核苷酸的值,"約4500個核苷酸"包括4050至4950 個核苷酸、優(yōu)選地4250至4750、更優(yōu)選地4490至4510、最優(yōu)選地4495至4505個核苷酸的 值,"約1500個核苷酸"包括1350至1650個核苷酸、優(yōu)選地1450至1550、更優(yōu)選地1490 至1510、最優(yōu)選地1495至1505個核苷酸的值,"約4000個核苷酸"包括3600至4400個核 苷酸、優(yōu)選地3800至4200、更優(yōu)選地3990至4010、更優(yōu)選地3995至4005個核苷酸的值, "約2000個核苷酸"包括1800至2200個核苷酸、優(yōu)選地1900至2100、更優(yōu)選地1990至 2010、最優(yōu)選地1995至2005個核苷酸的值,"約3500個核苷酸"包括3150至3850個核苷 酸、優(yōu)選地3300至3700、更優(yōu)選地3490至3510、最優(yōu)選地3495至3505個核苷酸的值,"約 2700個核苷酸"包括2430至2970個核苷酸、優(yōu)選地2600至2800、更優(yōu)選地2690至2710、 最優(yōu)選地2695至2705個核苷酸的值,"約3300個核苷酸"包括2970至3630個核苷酸,優(yōu) 選地3100至3500、更優(yōu)選地3290至3310、最優(yōu)選地3295至3305個核苷酸的值,"約3200 個核苷酸"包括2880至3520個核苷酸、優(yōu)選地3000至3400、更優(yōu)選地3190至3210、最優(yōu) 選地3195至3205個核苷酸,約+7000或約位置+7000包括位置+6300至+7700、優(yōu)選地位 置+6700至+7300、更優(yōu)選地位置+6990至+7010、最優(yōu)選地位置+6995至+7005,約+1或 約位置+1包括位置-10至+10、優(yōu)選地位置-5至+5、更優(yōu)選地位置-1至+2,約-3500或 約位置-3500包括位置-3150至-3850、優(yōu)選地位置-3300至-3700、更優(yōu)選地位置-3490 至-5010、最優(yōu)選地位置-3495至-3505。
[0047] 對于與SEQ ID號的序列中的位置相關的本文所涉及的或本文所用的針對人、小鼠 和大鼠源的GAPDH基因、IFF01基因和NCAPD2基因的DNA所用的編號,術語"約"包括偏離 最多±500bp、優(yōu)選地±100bp、更優(yōu)選地±10bp、最優(yōu)選地±5bp的值。
[〇〇48] 在一個實施方案中,本公開提供一種表達盒,其包含啟動子、編碼多肽的多核苷酸 序列和真核GAPDH啟動子下游的非翻譯性基因組DNA序列,其中由多核苷酸序列編碼的多 肽不是GAPDH,并且其中真核GAPDH啟動子下游的非翻譯性基因組DNA序列始于跨越核苷酸 位置約+1至核苷酸位置約+7000的區(qū)域內(nèi)部,其中核苷酸位置是相對于GAPDH mRNA轉(zhuǎn)錄 起始的,并且其中真核GAPDH啟動子下游的非翻譯性基因組DNA序列的長度是約100至約 15000個核苷酸。
[0049] 在一個實施方案中,真核GAPDH啟動子下游的非翻譯性基因組DNA序列的長度是 至少約100個核苷酸并且在其最大情況下延伸至IFF01基因的倒數(shù)第二內(nèi)含子或延伸至其 部份。在一個實施方案中,真核GAPDH啟動子下游的非翻譯性基因組DNA序列的長度是至 少約100個核苷酸并且在其最大情況下延伸至IFF01基因的最末內(nèi)含子。
[0050] 人IFF01基因位于第12號染色體(NCBI基因 ID :25900)約bp 6665249至bp 6648694的人DNA中。在一個實施方案中,在其最大情況下延伸至人中IFF01基因的最末內(nèi) 含子的真核GAPDH啟動子下游非翻譯性基因組DNA序列的長度在其最大情況下伸展至人中 編碼IFF01基因的第12號染色體的約bp 6650677(位置+7021)。在一個實施方案中,在 其最大情況下延伸至人中IFF01基因的倒數(shù)第二內(nèi)含子的真核GAPDH啟動子下游非翻譯性 基因組DNA序列的長度在其最大情況下伸展至人中編碼IFF01基因的第12號染色體的約 bp 6657230 (位置 +13574)。在顯示第 12 號染色體(NCBI 基因 ID :25900)的 bp 6657230 至bp 6639125的SEQ ID NO: 17中包含在其最大情況下分別延伸至人中IFF01基因的最末 內(nèi)含子和人中IFF01基因的倒數(shù)第二內(nèi)含子的真核GAPDH啟動子下游非翻譯性基因組DNA 序列。延伸至最末內(nèi)含子的真核GAPDH啟動子下游非翻譯性基因組DNA序列伸展至如SEQ ID N0:17所示的核苷酸序列的約bp 11553,并且延伸至倒數(shù)第二內(nèi)含子的真核GAPDH啟動 子下游非翻譯性基因組DNA序列伸展至如SEQ ID NO: 17所示核苷酸序列的約bp 18106。
[0051] 小鼠 IFF01基因(NCBI基因 ID :320678)位于第6號染色體的約bpl25095259至 125111800的小鼠 DNA中。在一個實施方案中,在其最大情況下延伸至小鼠中IFF01基因的 最末內(nèi)含子的真核GAPDH啟動子下游非翻譯性基因組DNA序列的長度在其最大情況下伸展 至小鼠中編碼IFF01基因的第6號染色體的約bp 125109211 (位置+6391)。在一個實施 方案中,在其最大情況下延伸至小鼠中IFF01基因的倒數(shù)第二內(nèi)含子的真核GAPDH啟動子 下游非翻譯性基因組DNA序列的長度在其最大情況下伸展至小鼠中編碼IFF01基因的第6 號染色體的約bp 125103521 (位置+12081)。在顯示第6號染色體(NCBI基因 ID :320678) 的bp 125103521至bp 125119832的SEQ ID NO: 18中包含在其最大情況下分別延伸至小 鼠中IFF01基因的最末內(nèi)含子和倒數(shù)第二內(nèi)含子的真核GAPDH啟動子下游非翻譯性基因組 DNA序列。延伸至小鼠中IFF01基因的最末內(nèi)含子的真核GAPDH啟動子下游非翻譯性基因 組DNA序列伸展至如SEQ ID N0:18所示的核苷酸序列的約bp 10622,并且延伸至小鼠中 IFF01基因的倒數(shù)第二內(nèi)含子的真核GAPDH啟動子下游非翻譯性基因組DNA序列伸展至如 SEQ ID N0:18所示核苷酸序列的約bp 16312。
[0052] 大鼠 IFF01基因(NCBI基因 ID :362437)位于第4號染色體的約bpl612649669至 bpl61282150的大鼠 DNA中。在一個實施方案中,在其最大情況下延伸至大鼠中IFF01基因 的最末內(nèi)含子的真核GAPDH啟動子下游非翻譯性基因組DNA序列的長度在其最大情況下伸 展至大鼠中編碼IFF01基因的第4號染色體的約bp 161280937(位置+5154)。在一個實施 方案中,在其最大情況下延伸至大鼠中IFF01基因的倒數(shù)第二內(nèi)含子的真核GAPDH啟動子 下游非翻譯性基因組DNA序列的長度在其最大情況下伸展至大鼠中編碼IFF01基因的第4 號染色體的約bp 161279451(位置+6640)。
[0053] 在顯示第 4 號染色體(NCBI 基因 ID :362437)的 bp 161279451 至 bpl61290508 的 SEQ ID N0:19中包含在其最大情況下分別延伸至大鼠中IFF01基因的最末內(nèi)含子和倒數(shù)第 二內(nèi)含子的真核GAPDH啟動子下游非翻譯性基因組DNA序列。延伸至IFF01基因的最末內(nèi) 含子的真核GAPDH啟動子下游非翻譯性基因組DNA序列伸展至如SEQ ID N0:19所示的核 苷酸序列的約bp 9572,并且延伸至IFF01基因的倒數(shù)第二內(nèi)含子的真核GAPDH啟動子下游 非翻譯性基因組DNA序列伸展至如SEQ ID N0:19所示核苷酸序列的約bp 11058。
[0054] 中國倉鼠 IFF01 基因 (NCBI 基因 ID :100753382)位于約 bp3577293 至 3593683 的 中國倉鼠 DNA中。在一個實施方案中,在其最大情況下延伸至中國倉鼠中IFF01基因的最末 內(nèi)含子的真核GAPDH啟動子下游非翻譯性基因組DNA序列的長度在其最大情況下伸展至中 國倉鼠中編碼IFF01基因的約bp 3579014 (位置+6883)。在一個實施方案中,在其最大情況 下延伸至中國倉鼠中IFF01基因的倒數(shù)第二內(nèi)含子的真核GAPDH啟動子下游非翻譯性基因 組DNA序列的長度在其最大情況下伸展至中國倉鼠中編碼IFF01基因的約bp 3585061(位 置+12930)。該染色體位置仍未在NCBI數(shù)據(jù)庫中注釋并且當前的序列信息含有許多未知的 堿基。因此對界限的精確注釋可以隨更精確序列信息的可獲得性而變化。
[0055] 在顯示bp3567932至bp3585061的SEQ ID N0:29中包含在其最大情況下分別延伸 至中國倉鼠中IFF01基因的最末內(nèi)含子和倒數(shù)第二內(nèi)含子的真核GAPDH啟動子下游非翻譯 性基因組DNA序列。延伸至IFF01基因的最末內(nèi)含子的真核GAPDH啟動子下游非翻譯性基 因組DNA序列伸展至如SEQ ID N0:29所示的核苷酸序列的約bp 11083,并且延伸至IFF01 基因的倒數(shù)第二內(nèi)含子的真核GAPDH啟動子下游非翻譯性基因組DNA序列伸展至如SEQ ID N0:29所示核苷酸序列的約bp 17130。
[0056] 在又一個實施方案中,真核GAPDH啟動子下游的非翻譯性基因組DNA序列始于真 核GAPDH多聚腺苷化位點處,例如始于編碼真核GAPDH多聚腺苷化位點的第一核苷酸。優(yōu) 選地,真核GAPDH啟動子下游的非翻譯性基因組DNA序列始于真核GAPDH多聚腺苷化位點 的下游,例如緊鄰編碼真核GAPDH多聚腺苷化位點的最末核苷酸之后開始。甚至更優(yōu)選的 真核GAPDH啟動子下游非翻譯性基因組DNA序列始于真核GAPDH多聚腺苷化位點的下游并 且真核GAPDH啟動子下游的非翻譯性基因組DNA序列的長度是至少約100個核苷酸并且在 其最大情況下延伸至IFF01基因的倒數(shù)第二內(nèi)含子。
[0057] 在一個實施方案中,真核GAPDH啟動子下游的非翻譯性基因組DNA序列始于跨越 核苷酸位置約+3881至核苷酸位置約+5000的區(qū)域內(nèi)部,優(yōu)選地始于跨越核苷酸位置約 +3931至核苷酸位置約+5000的區(qū)域內(nèi)部,更優(yōu)選地始于跨越核苷酸位置約+4070至核苷酸 位置約+5000的區(qū)域內(nèi)部,其中核苷酸位置是相對于GAPDH mRNA轉(zhuǎn)錄起始的。
[0058] 始于例如本發(fā)明中使用的真核GAPDH多聚腺苷化位點下游的真核GAPDH啟動子下 游非翻譯性基因組DNA序列通常始于核苷酸位置約位置+3931處,優(yōu)選地始于核苷酸位置 約+4070處,其中核苷酸位置是相對于GAPDH mRNA轉(zhuǎn)錄起始的。
[0059] 在人中,人GAPDH多聚腺苷化位點下游的非翻譯性基因組DNA序列始于約核苷酸 位置+3931處(相對于對應如SEQ ID N0:17中所顯示的bp8463的GAPDH mRNA轉(zhuǎn)錄起始)。 優(yōu)選地,如果GAPDH多聚腺苷化位點下游的非翻譯性基因組DNA序列來自人,則GAPDH多聚 腺苷化位點下游的非翻譯性基因組DNA序列始于約+3931 (相對于GAPDH mRNA轉(zhuǎn)錄起始; 其對應如SEQIDN0:17中所顯示的bp 8463),并且其長度是約3357bp,對應于從如SEQID N0:17中所顯示的約bp8463至約bpll819的序列,更優(yōu)選地它始于約+4070處(相對于對應 如SEQ ID N0:17中所顯示的bp 8602的GAPDH mRNA轉(zhuǎn)錄起始)并且其長度是約3218bp, 對應于從如SEQ ID NO: 17中所顯示的約bp8602至約bpll819的序列。
[0060] 在又一個實施方案中,真核GAPDH啟動子下游的非翻譯性基因組DNA序列包含選 自SEQ ID N0s:8和21的核苷酸序列或其片段。
[0061] 在又一個實施方案中,真核GAPDH啟動子下游的非翻譯性基因組DNA序列包含與 選自SEQ ID N0s:8和21的核苷酸序列或其片段互補的核苷酸序列。
[0062] 在又一個實施方案中,真核GAPDH啟動子下游的非翻譯性基因組DNA序列包含與 選自SEQ ID N0s:8和21的核苷酸序列或其片段相同至少80%的核苷酸序列。
[0063] 在一些實施方案中,選自SEQ ID N0s:8和21的核苷酸序列或其片段包含5個或 更少、優(yōu)選地4個或更少、更優(yōu)選地3個或更少、最優(yōu)選地2個或更少的、特別是1個核酸修 飾,其中核酸修飾優(yōu)選地是核酸置換。
[0064] 在又一個實施方案中,真核GAPDH啟動子下游的非翻譯性基因組DNA序列的長度 優(yōu)選地是約200至約8000個核苷酸、更優(yōu)選地約500至約5000個核苷酸、甚至更優(yōu)選地約 1000至約4500個核苷酸、最優(yōu)選地約1500至約4000個核苷酸、特別地約2000至約3500 個核苷酸、更特別約2700至約3300個、甚至更特別約3200個、最特別地3218個核苷酸。如 本文定義的真核GAPDH啟動子下游非翻譯性基因組DNA序列的長度不包括對非翻譯性基因 組DNA序列添加的任何接頭序列。
[〇〇65] 在又一個實施方案中,真核GAPDH啟動子下游的非翻譯性基因組DNA序列以與編 碼多肽的多核苷酸序列相同的方向定向。
[〇〇66] 在又一個實施方案中,真核GAPDH啟動子下游的非翻譯性基因組DNA序列以相對 于編碼多肽的多核苷酸序列相反方向定向。
[〇〇67] 在一些實施方案中,包含啟動子、編碼多肽的多核苷酸序列和真核GAPDH啟動子 下游非翻譯性基因組DNA序列的表達盒還包含真核GAPDH啟動子上游的非翻譯性基因組 DNA序列,其中真核GAPDH啟動子上游的非翻譯性基因組DNA序列始于跨越約真核GAPDH啟 動子的5'末端至核苷酸位置約-3500的區(qū)域內(nèi)部,其中核苷酸位置是相對于GAPDH mRNA 轉(zhuǎn)錄起始,并且其中真核GAPDH啟動子上游的非翻譯性基因組DNA序列的長度是約100至 約15000個核苷酸。
[〇〇68] 在另一個實施方案中,該表達盒包含啟動子、編碼多肽的多核苷酸序列和真 核GAPDH啟動子上游的非翻譯性基因組DNA序列,其中由多核苷酸序列編碼的多肽不是 GAPDH,并且其中真核GAPDH啟動子上游的非翻譯性基因組DNA序列始于跨越約真核GAPDH 啟動子的5'末端至核苷酸位置約-3500的區(qū)域內(nèi)部,其中核苷酸位置是相對于GAPDH mRNA 轉(zhuǎn)錄起始的,其中真核GAPDH啟動子上游的非翻譯性基因組DNA序列的長度是100至約 15000個核苷酸,條件是表達盒不包含真核GAPDH啟動子或其片段。
[0069] 在一些實施方案中,該表達盒還包含真核GAPDH啟動子下游的非翻譯性基因組 DNA序列,其中真核GAPDH啟動子下游的非翻譯性基因組DNA序列始于跨越核苷酸位置約 +1至核苷酸位置約+7000的區(qū)域內(nèi)部,其中核苷酸位置是相對于GAPDH mRNA轉(zhuǎn)錄起始的, 并且其中真核GAPDH啟動子下游的非翻譯性基因組DNA序列的長度是約100至約15000個 核苷酸。在這些實施方案中,使用的真核GAPDH啟動子下游非翻譯性基因組DNA序列例如 如上文描述。
[0070] 在一些實施方案中,真核GAPDH啟動子上游的非翻譯性基因組DNA序列的長度優(yōu) 選地是約200至約8000個核苷酸、更優(yōu)選地約500至約5000個核苷酸、甚至更優(yōu)選地約 1000至約4500個核苷酸、最優(yōu)選地約1500至約4000個核苷酸、特別地約2000至約3500 個核苷酸、更特別約2700至約3300個、甚至更特別約3200個、最特別地3158個核苷酸長 度。如本文定義的真核GAPDH啟動子上游非翻譯性基因組DNA序列的長度不包括對非翻譯 性基因組DNA序列添加的任何接頭序列。
[0071] 在又一個實施方案中,真核GAPDH啟動子上游的非翻譯性基因組DNA序列的長度 是至少約100個核苷酸并且在其最大情況下延伸至NCAPD2基因的起始密碼子。在又一個 實施方案中,真核GAPDH啟動子上游的非翻譯性基因組DNA序列的長度是至少約100個核 苷酸并且在其最大情況下延伸至NCAPD2基因的倒數(shù)第三內(nèi)含子。在又一個實施方案中,真 核GAPDH啟動子上游的非翻譯性基因組DNA序列的長度是至少約100個核苷酸并且在其最 大情況下延伸至NCAPD2基因的倒數(shù)第二內(nèi)含子。在又一個實施方案中,真核GAPDH啟動子 上游的非翻譯性基因組DNA序列的長度是至少約100個核苷酸并且在其最大情況下延伸至 NCAPD2基因的最末內(nèi)含子。
[0072] 人NCAPD2基因(NCBI基因 ID :9918)位于第12號染色體約bp6603298至 bp6641132的人DNA中。在一個實施方案中,在其最大情況下延伸至人中NCAPD2基因的最 末內(nèi)含子的真核GAPDH啟動子上游非翻譯性基因組DNA序列的長度在其最大情況下伸展至 人中編碼NCAPD2基因的第12號染色體的約bp 6640243 (相對于GAPDH基因轉(zhuǎn)錄起始的位 置-3414,對應 SEQ ID N0:17 中 bp 1119)。
[0073] 在一個實施方案中,在其最大情況下延伸至人中NCAPD2基因的倒數(shù)第二內(nèi)含子 的真核GAPDH啟動子上游非翻譯性基因組DNA序列的長度在其最大情況下伸展至人中編碼 NCAPD2基因的第12號染色體的約bp6639984 (相對于GAPDH基因轉(zhuǎn)錄起始的位置-3673, 對應 SEQ ID N0:17 中 bp860)。
[0074] 在一個實施方案中,在其最大情況下延伸至人中NCAPD2基因的倒數(shù)第三內(nèi)含子 的真核GAPDH啟動子上游非翻譯性基因組DNA序列的長度在其最大情況下伸展至人中編碼 NCAPD2基因的第12號染色體的約bp6639125 (相對于GAPDH基因轉(zhuǎn)錄起始的位置-4532 ; 其對應SEQ ID N0:17中的bp 1)。
[0075] 在顯示第 12 號染色體(NCBI 基因 ID :9918)的 bp 6657230 至 bp6639125 的 SEQ ID NO: 17中包含在其最大情況下分別延伸至人中NCAPD2基因的最末內(nèi)含子、倒數(shù)第二內(nèi) 含子和倒數(shù)第三內(nèi)含子的真核GAPDH啟動子上游非翻譯性基因組DNA序列。
[0076] 小鼠 NCAPD2基因(基因 ID :68298)位于第6號染色體的約位置125118025至 125141604的小鼠 DNA中。在一個實施方案中,在其最大情況下延伸至小鼠中NCAPD2基因 的最末內(nèi)含子的真核GAPDH啟動子上游非翻譯性基因組DNA序列的長度(據(jù)估計具有轉(zhuǎn)錄 起始上游的500bp長度)在其最大情況下伸展至小鼠中編碼NCAPD2基因的第6號染色體 的約 125118607。
[0077] 在一個實施方案中,在其最大情況下延伸至小鼠中NCAPD2基因的倒數(shù)第二內(nèi)含 子的真核GAPDH啟動子上游非翻譯性基因組DNA序列的長度在其最大情況下伸展至小鼠中 編碼NCAPD2基因的第6號染色體的約bp 125118880。
[0078] 在一個實施方案中,在其最大情況下延伸至小鼠中NCAPD2基因的倒數(shù)第三內(nèi)含 子的真核GAPDH啟動子上游非翻譯性基因組DNA序列的長度在其最大情況下伸展至小鼠中 編碼NCAPD2基因的第6號染色體的約bp 125119832。
[0079] 在顯示第 6 號染色體(NCBI 基因 ID :68298)的 bpl25103521 至 bpl25119832 的 SEQ ID N0:18中包含在其最大情況下分別延伸至小鼠中NCAPD2基因的最末內(nèi)含子、倒數(shù)第 二內(nèi)含子和倒數(shù)第三內(nèi)含子的真核GAPDH啟動子上游非翻譯性基因組DNA序列。延伸至最 末內(nèi)含子的真核GAPDH啟動子上游非翻譯性基因組DNA序列伸展至如SEQ ID N0:18所顯 示的核苷酸序列的約bp 1226(相對于小鼠 GAPDH mRNA轉(zhuǎn)錄起始的-3006)。延伸至倒數(shù)第 二內(nèi)含子的真核GAPDH啟動子下游非翻譯性基因組DNA序列伸展至如SEQ ID N0:18所顯 示的核苷酸序列的約bp953(相對于小鼠 GAPDH mRNA轉(zhuǎn)錄起始的-3279)。延伸至倒數(shù)第三 內(nèi)含子的真核GAPDH啟動子下游非翻譯性基因組DNA序列伸展至如SEQ ID N0:18所顯示 的核苷酸序列的約bp 1 (相對于小鼠 GAPDH mRNA轉(zhuǎn)錄起始的-4231)。
[0080] 大鼠 NCAPD2基因(基因 ID :362438)位于第4號染色體的約位置161288671至 161310417的真核DNA中。在一個實施方案中,在其最大情況下延伸至大鼠中NCAPD2基因 的最末內(nèi)含子的真核GAPDH啟動子上游非翻譯性基因組DNA序列的長度在其最大情況下伸 展至大鼠中編碼NCAPD2基因的第4號染色體的約bp 161289191。在一個實施方案中,在其 最大情況下延伸至大鼠中NCAPD2基因的倒數(shù)第二內(nèi)含子的真核GAPDH啟動子上游非翻譯 性基因組DNA序列的長度在其最大情況下伸展至大鼠中編碼NCAPD2基因的第4號染色體 的約bp 161289446。在一個實施方案中,在其最大情況下延伸至大鼠中NCAPD2基因的倒數(shù) 第三內(nèi)含子的真核GAPDH啟動子上游非翻譯性基因組DNA序列的長度在其最大情況下伸展 至大鼠中編碼NCAPD2基因的第4號染色體的約bpl61290508。
[0081] 在顯示第 4 號染色體(NCBI 基因 ID :362438)的 bpl61279451 至 bpl61290508 的 SEQ ID N0:19中包含在其最大情況下分別延伸至大鼠中NCAPD2基因的最末內(nèi)含子、倒數(shù)第 二內(nèi)含子和倒數(shù)第三內(nèi)含子的真核GAPDH啟動子上游非翻譯性基因組DNA序列。延伸至最 末內(nèi)含子的真核GAPDH啟動子上游非翻譯性基因組DNA序列伸展至如SEQ ID N0:19所顯 示的核苷酸序列的約bp 1318(相對于大鼠 GAPDH mRNA轉(zhuǎn)錄起始的-3101)。延伸至倒數(shù)第 二內(nèi)含子的真核GAPDH啟動子下游非翻譯性基因組DNA序列伸展至如SEQ ID N0:19所顯 示的核苷酸序列的約bp 1063(相對于大鼠 GAPDH mRNA轉(zhuǎn)錄起始的位置-3356)。延伸至倒 數(shù)第三內(nèi)含子的真核GAPDH啟動子下游非翻譯性基因組DNA序列伸展至如SEQ ID N0:19 所顯示的核苷酸序列的約bp 1 (相對于大鼠 GAPDH mRNA轉(zhuǎn)錄起始的位置-4418)。
[0082] 中國倉鼠 NCAPD2基因(基因 ID :100753087)位于約位置3544184至3569879的 真核DNA中。該染色體位置在NCBI數(shù)據(jù)庫上不可獲得。在一個實施方案中,在其最大情況 下延伸至中國倉鼠中NCAPD2基因的最末內(nèi)含子的真核GAPDH啟動子上游非翻譯性基因組 DNA序列的長度在其最大情況下伸展至中國倉鼠中的約3569380bp。在一個實施方案中,在 其最大情況下延伸至中國倉鼠中NCAPD2基因的倒數(shù)第二內(nèi)含子的真核GAPDH啟動子上游 非翻譯性基因組DNA序列的長度在其最大情況下伸展至中國倉鼠中的約3569131bp。在一 個實施方案中,在其最大情況下延伸至中國倉鼠中NCAPD2基因的倒數(shù)第三內(nèi)含子的真核 GAPDH啟動子上游非翻譯性基因組DNA序列的長度在其最大情況下伸展至中國倉鼠中的約 3567932bp。
[0083] 在顯示bp3567932至bp3585061的SEQ ID N0:29中包含在其最大情況下分別延伸 至中國倉鼠中NCAPD2基因的最末內(nèi)含子、倒數(shù)第二內(nèi)含子和倒數(shù)第三內(nèi)含子的真核GAPDH 啟動子上游非翻譯性基因組DNA序列。延伸至最末內(nèi)含子的真核GAPDH啟動子上游非翻譯 性基因組DNA序列伸展至如SEQ ID N0:29所顯示的核苷酸序列的約bp 1449(相對于中國 倉鼠 GAPDH mRNA轉(zhuǎn)錄起始的-2752)。延伸至倒數(shù)第二內(nèi)含子的真核GAPDH啟動子下游非 翻譯性基因組DNA序列伸展至如SEQ ID N0:29所顯示的核苷酸序列的約bp 1200(相對于 中國倉鼠 GAPDH mRNA轉(zhuǎn)錄起始的位置-3001)。延伸至倒數(shù)第三內(nèi)含子的真核GAPDH啟動 子下游非翻譯性基因組DNA序列伸展至如SEQ ID N0:29所顯示的核苷酸序列的約bp 1 (相 對于中國倉鼠 GAPDH mRNA轉(zhuǎn)錄起始的位置-4200)。
[0084] 在一些實施方案中,真核GAPDH啟動子上游的非翻譯性基因組DNA序列通常始 于跨越核苷酸位置約-500至核苷酸位置約-3500區(qū)域內(nèi)部,優(yōu)選地始于跨越核苷酸位置 約-576至核苷酸位置約-3500區(qū)域內(nèi)部,其中核苷酸位置是相對于GAPDH mRNA轉(zhuǎn)錄起始 的。
[0085] 在一些實施方案中,真核GAPDH啟動子上游的非翻譯性基因組DNA序列通常始于 核苷酸位置約位置-500處,優(yōu)選地始于核苷酸位置約-576處,其中核苷酸位置是相對于 GAPDH mRNA轉(zhuǎn)錄起始的。
[0086] 在人中,人GAPDH啟動子上游的非翻譯性基因組DNA序列始于約核苷酸位置-463 處(相對于對應如SEQ ID N0:17中所顯示的bp4533的GAPDH mRNA轉(zhuǎn)錄起始)。優(yōu)選地,如 果GAPDH啟動子上游的非翻譯性基因組DNA序列來自人,則該GAPDH啟動子上游的非翻譯 性基因組DNA序列始于約-500處(相對于GAPDH mRNA轉(zhuǎn)錄起始;其對應如SEQ ID N0:17 中所顯示的bp 4533)。更優(yōu)選地,如果GAPDH啟動子上游的非翻譯性基因組DNA序列來自 人,則該GAPDH啟動子上游的非翻譯性基因組DNA序列始于約-576處(相對于GAPDH mRNA 轉(zhuǎn)錄起始;其對應如SEQ ID NO: 17中所顯示的bp 4533),并且其長度是約3158bp,對應于 從如SEQ ID N0:17中所顯示的約bp800至約bp3957的序列。
[0087] 在又一個實施方案中,真核GAPDH啟動子上游的非翻譯性基因組DNA序列包含選 自 SEQ ID N0s:7、9、10、ll、12、13、14、15、16、20、22、23、24、25、26、27 和 28 的核苷酸序列或 其片段,優(yōu)選地選自SEQ ID N0s:7、9、10、11、12、13、14、15和16的核苷酸序列或其片段,或 選自SEQ ID勵8:20、22、23、24、25、26、27、28和16的核苷酸序列或其片段。更優(yōu)選地是選 自SEQIDN0s :10、12、15和16的核苷酸序列或其片段,更優(yōu)選地是選自SEQIDN0s:10、 12、15和16的核苷酸序列或其片段,其中包含SEQ ID NOs: 10和/或16的核苷酸序列相對 于編碼多肽的多核苷酸序列以相反方向定向,并且包含SEQ ID NOs: 12和/或15的核苷酸 序列以與編碼多肽的多核苷酸序列相同的方向定向。同等更優(yōu)選地是選自SEQ ID N0s:23、 25、28和16的核苷酸序列或其片段,更優(yōu)選地是選自SEQ ID N0s:23、25、28和16的核苷酸 序列或其片段,其中包含SEQ ID NOs: 23和/或16的核苷酸序列相對于編碼多肽的多核苷 酸序列以相反方向定向,并且包含SEQ ID NOs:25和/或28的核苷酸序列以與編碼多肽的 多核苷酸序列相同的方向定向。
[0088] 在又一個實施方案中,真核GAPDH啟動子上游的非翻譯性基因組DNA序列包含與 選自 SEQ ID N0s:7、9、10、ll、12、13、14、15、16、20、22、23、24、25、26、27 和 28 的核苷酸序列 或其片段互補的核苷酸序列,優(yōu)選地與選自SEQ ID勵8:7、9、10、11、12、13、14、15和16的 核苷酸序列或其片段互補的核苷酸序列或與選自SEQ ID N0s:20、22、23、24、25、26、27、28 和16的核苷酸序列或其片段互補的核苷酸序列。更優(yōu)選地是與選自SEQ ID NOs: 10、12、15 和16的核苷酸序列或其片段互補的核苷酸序列。同等地更優(yōu)選地是與選自SEQ ID N0s:23、 25、28和16的核苷酸序列或其片段互補的核苷酸序列。
[0089] 在又一個實施方案中,真核GAPDH啟動子上游的非翻譯性基因組DNA序列包含與 選自 SEQ ID N0s:7、9、10、ll、12、13、14、15、16、20、22、23、24、25、26、27 和 28 的核苷酸序列 或其片段相同至少80%的核苷酸序列,優(yōu)選地與選自SEQ ID N0s:7、9、10、11、12、13、14、15 和16的核苷酸序列或其片段相同至少80%的核苷酸序列或與選自SEQ ID N0s:20、22、23、 24、25、26、27、28和16的核苷酸序列或其片段相同至少80%的核苷酸序列。更優(yōu)選地是與 選自SEQ ID NOs: 10、12、15和16的核苷酸序列或其片段相同至少80%的核苷酸序列,更優(yōu) 選地是與選自SEQ ID N0s:10、12、15和16的核苷酸序列或其片段相同至少80%的核苷酸 序列,其中包含SEQ ID NOs: 10和/或16的核苷酸序列相對于編碼多肽的多核苷酸序列以 相反方向定向,并且包含SEQ ID NOs:12和/或15的核苷酸序列以與編碼多肽的多核苷酸 序列相同的方向定向。同等更優(yōu)選地是與選自SEQ ID N0s:23、25、28和16的核苷酸序列 或其片段相同至少80%的核苷酸序列,更優(yōu)選地是與選自SEQ ID NOs:23、25、28和16的核 苷酸序列或其片段相同至少80%的核苷酸序列,其中包含SEQ ID NOs:23和/或16的核苷 酸序列相對于編碼多肽的多核苷酸序列以相反方向定向,并且包含SEQ ID N0s:25和/或 28的核苷酸序列以與編碼多肽的多核苷酸序列相同的方向定向。
[0090] 在一些實施方案中,選自 SEQ ID N0s:7、9、10、ll、12、13、14、15、16、20、22、23、24、 25、26、27和28的核苷酸序列或其片段包含5個或更少、優(yōu)選地4個或更少、更優(yōu)選地3個 或更少、最優(yōu)選地2個或更少的、特別是1個核酸修飾,其中核酸修飾優(yōu)選地是核酸置換。
[0091] 在一些實施方案中,選自SEQ ID勵8:7、9、11、14、20、22、24和27的核苷酸序列或 其片段包含5個或更少、優(yōu)選地4個或更少、更優(yōu)選地3個或更少、最優(yōu)選地2個或更少的、 特別是1個核酸修飾,其中核酸修飾優(yōu)選地是核酸置換。
[0092] 在一些實施方案中,選自SEQ ID N0s:7、9、ll、14的核苷酸序列或其片段在第16 位置處相對于SEQ ID N0s:7、9、ll、14的核苷酸序列的起始包含一個核酸置換。優(yōu)選地在 第16位置處的G相對于核苷酸序列起始替換為T。
[0093] 在一些實施方案中,選自SEQ ID N0s:20、22、24和27的核苷酸序列或其片段在第 13位置處相對于SEQ ID N0s:20、22、24和27的核苷酸序列的起始包含一個核酸置換。優(yōu) 選地在第13位置處的G相對于核苷酸序列起始替換為T。
[0094] 在又一個實施方案中,真核GAPDH啟動子上游的非翻譯性基因組DNA序列以與編 碼多肽的多核苷酸序列相同的方向定向。
[〇〇95] 在又一個實施方案中,真核GAPDH啟動子上游的非翻譯性基因組DNA序列相對于 編碼多肽的多核苷酸序列以相反方向定向。
[〇〇96] 在優(yōu)選實施方案中,如上文描述,表達盒包含啟動子、編碼多肽的多核苷酸序列和 真核GAPDH啟動子下游的非翻譯性基因組DNA序列和真核GAPDH啟動子上游的非翻譯性基 因組DNA序列。優(yōu)選地,真核GAPDH啟動子下游的非翻譯性基因組DNA序列和真核GAPDH 啟動子上游的非翻譯性基因組DNA序列的起源是相同的,S卩,是相同物種的。更優(yōu)選地,真 核GAPDH啟動子下游非翻譯性基因組DNA序列、真核GAPDH啟動子上游非翻譯性基因組DNA 序列和宿主細胞的起源是相同的,即,是相同物種的,例如真核GAPDH啟動子下游非翻譯性 基因組DNA序列、真核GAPDH啟動子上游的非翻譯性基因組DNA序列和宿主細胞的起源來 自相同的哺乳動物,例如來自人。
[0097] 在一些實施方案中,如果真核GAPDH啟動子下游和/或上游的非翻譯性基因組DNA 序列是來自一個物種的非翻譯性基因組DNA序列,則表達盒的啟動子不是來自相同物種的 GATOH啟動子。
[0098] 在一些實施方案中,如果真核GAPDH啟動子下游和/或上游的非翻譯性基因組DNA 序列是人源下游和/或上游的非翻譯性基因組DNA序列,則表達盒的啟動子不是人GAPDH 啟動子。
[0099] 在一些實施方案中,表達盒的啟動子不是GAPDH啟動子。
[〇1〇〇] 在一個實施方案中,如果表達盒包含啟動子、編碼多肽的多核苷酸序列和真核甘 油醛3-磷酸脫氫酶(GAPDH)啟動子下游的非翻譯性基因組DNA序列,其中由多核苷酸序列 編碼的多肽不是GAPDH,并且其中真核GAPDH啟動子下游的非翻譯性基因組DNA序列始于 跨越核苷酸位置約+1至核苷酸位置約+7000的區(qū)域內(nèi)部,其中核苷酸位置是相對于GAPDH mRNA轉(zhuǎn)錄起始的,并且其中真核GAPDH啟動子下游的非翻譯性基因組DNA序列的長度是約 100至約15000個核苷酸并且其中表達盒還包含真核GAPDH啟動子上游的非翻譯性基因組 DNA序列,其中真核GAPDH啟動子上游的非翻譯性基因組DNA序列始于跨越約真核GAPDH啟 動子的5'末端至核苷酸位置約-3500的區(qū)域內(nèi)部,其中核苷酸位置是相對于GAPDH mRNA 轉(zhuǎn)錄起始的,并且其中真核GAPDH啟動子上游的非翻譯性基因組DNA序列的長度是約100 至約15000個核苷酸,表達盒的啟動子可以是真核GAPDH啟動子,優(yōu)選地是哺乳動物GAPDH 啟動子,更優(yōu)選地是嚙齒類或人GAPDH啟動子。在這個實施方案中,始于跨越約真核GAPDH 啟動子的5'末端至核苷酸位置約-3500的區(qū)域內(nèi)部的真核GAPDH啟動子上游非翻譯性基 因組DNA序列優(yōu)選地剛好位于真核GAPDH啟動子的上游,更優(yōu)選地在這個實施方案中,表達 盒包含天然存在的基因組DNA序列,所述基因組DNA序列包含真核GAPDH啟動子并延伸至 核苷酸位置約-3500,其中核苷酸位置是相對于GAPDH mRNA轉(zhuǎn)錄起始的。
[〇1〇1] 在一些實施方案中,真核GAPDH啟動子下游和/或上游的非翻譯性基因組DNA序 列是哺乳動物源的,例如真核GAPDH啟動子是哺乳動物GAPDH啟動子,并且哺乳動物GAPDH 啟動子下游和/或上游的非翻譯性基因組DNA序列如本文所述那樣使用。
[0102] 在一些實施方案中,真核GAPDH啟動子下游和/或上游的非翻譯性基因組DNA序 列是嚙齒類或人源的,例如真核GAPDH啟動子是嚙齒類或人GAPDH啟動子,并且嚙齒類或人 GAPDH啟動子下游和/或上游的非翻譯性基因組DNA序列如本文所述那樣使用。
[0103] 優(yōu)選地,真核GAPDH啟動子下游和/或上游的非翻譯性基因組DNA序列選自人、大 鼠或小鼠源,更優(yōu)選地來自人源或小鼠源,最優(yōu)選地來自人源。
[0104] 在一些實施方案中,真核GAPDH啟動子下游和/或上游的非翻譯性基因組DNA序 列未與編碼多肽的多核苷酸序列有效連接。
[0105] 在一些實施方案中,表達盒包含多聚腺苷化位點。優(yōu)選地,多聚腺苷化位點選自 SV40poly(A)和 BGH (牛生長激素)poly(A)。
[0106] 在一些實施方案中,表達盒的啟動子和編碼多肽的多核苷酸序列有效連接。
[0107] 在一些實施方案中,表達盒的啟動子選自SV40啟動子、人tk啟動子、MPSV啟動子、 小鼠 CMV、人CMV、大鼠 CMV、人EFla、中國倉鼠 EFla、人GAPDH、雜合啟動子,所述雜合啟動 子包括MYC、HYK和CX啟動子。
[0108] 在一些實施方案中,由表達盒編碼的多肽可以是非糖基化多肽和糖基化多肽。糖 基化多肽指具有至少一條寡糖鏈的多肽。
[0109] 非糖基化蛋白的例子是例如非糖基化激素;非糖基化酶;神經(jīng)生長因子(NGF)家 族、上皮生長因子(EGF)和成纖維細胞生長因子(FGF)家族的非糖基化生長因子以及激素 和生長因子的非糖基化受體。
[〇11〇] 糖基化蛋白的例子是激素和激素釋放因子、凝血因子、抗凝血因子、激素或生長因 子的受體、神經(jīng)營養(yǎng)因子細胞因子和它們的受體、T細胞受體、表面膜蛋白、轉(zhuǎn)運蛋白、歸巢 受體、地址素、調(diào)節(jié)蛋白、抗體、嵌合蛋白(如免疫黏附素)和任何糖基化蛋白的片段。優(yōu)選 地,多肽選自抗體,抗體片段或抗體衍生物(例如Fc融合蛋白和特殊抗體樣式,如雙特異性 抗體)。如本文所用的抗體片段包括,但不限于(i)結(jié)構域;(ii)由VL、VH、CL或CK和CH1 結(jié)構域組成的Fab片段,包括Fab'和Fab' -SH ; (iii)由VH和CH1結(jié)構域組成的Fd片段; (iv)由單個可變域組成的dAb 片段(Ward ES 等人,(1989)Nature, 341 (6242) :544-6) ;(v) F(ab')2片段,一種包含兩個連接的Fab片段的雙價片段;(vi)單鏈Fv分子(scFv),其中VH 結(jié)構域和VL結(jié)構域由允許這兩個結(jié)構域締合以形成抗原結(jié)合位點的肽接頭連接(Bird RE 等人,(1988) Science, 242 (4877) :423-6 ;Huston JS 等人,(1988) Proc Natl Acad Sci U S A,85 (16) :5879-83) ;(vii) "雙抗體"或"三抗體",通過基因融合所構建的多價或多特異性 片段(Hoiliger P 等人,(1993) Proc Natl Acad Sci U S A, 90 (14) :6444-8 ;Holliger P 等 人,(2000)Methods Enzymol, 326:461-79) ;(viii)scFv,與 Fc 區(qū)融合的雙抗體(diabody) 或結(jié)構域抗體和(ix)與相同或不同抗體融合的scFv。
[0111] 在一些實施方案中,表達盒還包含遺傳元件,所述遺傳元件選自額外的啟動子、增 強子、轉(zhuǎn)錄控制元件和選擇標記,優(yōu)選地在動物細胞中表達的選擇標記。轉(zhuǎn)錄控制元件例如 是Kozak序列或轉(zhuǎn)錄終止子元件。
[0112] 在一個實施方案中,遺傳元件是一種選擇標記,其中在編碼選擇標記的多核苷酸 序列中含有的CpG位點的含量是45或更小,優(yōu)選地是40或更小,更優(yōu)選地是20或更小,特 別地是10或更小,更特別地是5或更小,最特別地是0 (已經(jīng)徹底移除CpG位點)。
[0113] 在又一個方面,本公開提供表達載體,優(yōu)選地包含如上文所述表達盒的哺乳動物 表達載體。
[0114] 在一些實施方案中,表達載體包含至少兩個獨立的轉(zhuǎn)錄單位。具有兩個獨立轉(zhuǎn)錄 單位的表達載體也稱作雙基因載體。其例子是其中第一轉(zhuǎn)錄單位編碼抗體重鏈或其片段且 第二轉(zhuǎn)錄單位編碼抗體輕鏈的載體。另一個例子是其中兩個轉(zhuǎn)錄單位編碼蛋白質(zhì)(如酶) 的兩個不同亞基的雙基因載體。然而,還可能的是本發(fā)明的表達載體包含多于兩個獨立轉(zhuǎn) 錄單位,例如三、四或甚至更多個獨立轉(zhuǎn)錄單位,所述獨立轉(zhuǎn)錄單位各自包含編碼不同多肽 鏈的不同核苷酸序列。其例子是具有4個獨立轉(zhuǎn)錄單位的載體,所述獨立轉(zhuǎn)錄單位各自含 有編碼由4個不同亞基組成的酶的一個亞基的不同核苷酸序列。
[0115] 在一些實施方案中,表達載體還包含選自額外啟動子、增強子,轉(zhuǎn)錄控制單元、復 制起點和選擇標記的遺傳元件。
[0116] 在一些實施方案中,表達載體還包含復制起點和選擇標記,其中表達載體的編碼 復制起點和選擇標記的多核苷酸序列中所含的CpG位點的含量是200或更小,優(yōu)選地是150 或更小,特別地是100或更小,更特別地是50或更小,最特別地是30或更小。
[0117] 常使用的任何選擇標記如胸苷激酶(tk)、二氫葉酸還原酶(DHFR)、嘌呤霉素、新 霉素或谷氨酰胺合成酶(GS)可以用于本發(fā)明的表達盒或表達載體。優(yōu)選地,本發(fā)明的表達 載體還包含有限數(shù)目的有用限制性位點用于插入分泌本發(fā)明異源蛋白的表達盒。在僅特別 用于瞬時/附加型表達使用時,本發(fā)明的表達載體還可以包含在真核宿主細胞中用于自主 復制/附加型維持的復制起點如EB病毒(EBV)或SV40病毒的oriP起點,但是可以缺少選 擇標記。還可能在缺少促進載體復制的相關因子的細胞中瞬時表達。
[0118] 攜帶表達盒的表達載體還可以包含編碼熒光標記的表達盒、編碼ncRNA的表達 盒、編碼抗凋亡蛋白的表達盒或編碼增加分泌途徑容量的蛋白質(zhì)的表達盒。
[0119] 在又一個方面,本公開提供一種表達載體,其依次包含:
[0120] a)真核GAPDH啟動子上游和/或下游的非翻譯性基因組DNA序列
[0121] b)啟動子
[0122] c)編碼多肽的多核苷酸序列
[0123] d)多聚腺苷化位點
[0124] e)增強子
[0125] f)真核GAPDH啟動子下游和/或上游的非翻譯性基因組DNA序列,或
[0126] a)真核GAPDH啟動子上游和/或下游的非翻譯性基因組DNA序列
[0127] b)增強子
[0128] c)啟動子
[0129] d)編碼多肽的多核苷酸序列
[0130] e)多聚腺苷化位點
[0131] f)真核GAPDH啟動子下游和/或上游的非翻譯性基因組DNA序列,或
[0132] a)增強子
[0133] b)真核GAPDH上游和/或下游的非翻譯性基因組DNA序列
[0134] c)啟動子
[0135] d)編碼多肽的多核苷酸序列
[0136] e)多聚腺苷化位點
[0137] f)真核GAPDH下游和/或上游的非翻譯性基因組DNA序列,
[0138] 其中包含增強子是任選的,并且其中由多核苷酸序列編碼的多肽不是GAPDH,并且 其中真核GAPDH啟動子下游的非翻譯性基因組DNA序列始于跨越核苷酸位置約+1至核苷 酸位置約+7000的區(qū)域內(nèi)部,其中核苷酸位置是相對于GAPDH mRNA轉(zhuǎn)錄起始的,并且其中 真核GAPDH啟動子下游的非翻譯性基因組DNA序列的長度是約100至約15000個核苷酸并 且其中真核GAPDH啟動子上游的非翻譯性基因組DNA序列始于跨越約真核GAPDH啟動子的 5'末端至核苷酸位置約-3500的區(qū)域內(nèi)部,其中核苷酸位置是相對于GAPDH mRNA轉(zhuǎn)錄起始 的,并且其中真核GAPDH啟動子上游的非翻譯性基因組DNA序列的長度是約100至約15000 個核苷酸,條件是如果a)或b)是真核GAPDH上游的非翻譯性基因組DNA序列,則f)是真 核GAPDH下游的非翻譯性基因組DNA序列,并且如果a)或b)是真核GAPDH下游的非翻譯 性基因組DNA序列,則f)是真核GAPDH上游的非翻譯性基因組DNA序列。
[0139] 在一些實施方案中,本公開提供一種表達載體,其依次包含:
[0140] a)真核GAPDH啟動子上游的非翻譯性基因組DNA序列
[0141] b)啟動子
[0142] c)編碼多肽的多核苷酸序列
[0143] d)多聚腺苷化位點
[0144] e)增強子
[0145] f)真核GAPDH啟動子下游的非翻譯性基因組DNA序列,其中包含增強子是任選的。
[0146] 在又一個方面,本公開提供一種表達載體,其依次包含:
[0147] a)真核GAPDH啟動子上游的非翻譯性基因組DNA序列
[0148] b)增強子
[0149] c)啟動子
[0150] d)編碼多肽的多核苷酸序列
[0151] e)多聚腺苷化位點
[0152] f)真核GAPDH下游的非翻譯性基因組DNA序列,
[0153] 其中包含增強子是任選的。
[0154] 在又一個方面,本公開提供一種表達載體,其依次包含:
[0155] a)增強子
[0156] b)真核GAPDH上游的非翻譯性基因組DNA序列
[0157] c)啟動子
[0158] c)編碼多肽的多核苷酸序列
[0159] e)多聚腺苷化位點
[0160] f)真核GAPDH下游的非翻譯性基因組DNA序列,
[0161] 其中包含增強子是任選的。
[0162] 在又一個方面,本公開提供一種表達載體,其依次包含:
[0163] a)真核GAPDH啟動子下游的非翻譯性基因組DNA序列
[0164] b)啟動子
[0165] c)編碼多肽的多核苷酸序列
[0166] d)多聚腺苷化位點
[0167] e)增強子
[0168] f)真核GAPDH啟動子上游的非翻譯性基因組DNA序列,其中包含增強子是任選的。
[0169] 在又一個方面,本公開提供一種表達載體,其依次包含:
[0170] a)真核GAPDH啟動子下游的非翻譯性基因組DNA序列
[0171] b)增強子
[0172] c)啟動子
[0173] d)編碼多肽的多核苷酸序列
[0174] e)多聚腺苷化位點
[0175] f)真核GAPDH上游的非翻譯性基因組DNA序列
[0176] 其中包含增強子是任選的。
[0177] 在又一個方面,本公開提供一種表達載體,其依次包含:
[0178] a)增強子
[0179] b)真核GAPDH下游的非翻譯性基因組DNA序列
[0180] c)啟動子
[0181] d)編碼多肽的多核苷酸序列
[0182] e)多聚腺苷化位點
[0183] f)真核GAPDH上游的非翻譯性基因組DNA序列,
[0184] 其中包含增強子是任選的。
[0185] 表達載體的真核GAPDH上游非翻譯性基因組DNA序列、增強子、啟動子、編碼多肽 的多核苷酸序列、多聚腺苷化位點和真核GAPDH啟動子下游非翻譯性基因組DNA序列例如 如上文描述。
[0186] 在又一個方面,本公開提供包含如上文描述的表達盒或表達載體的宿主細胞。該 宿主細胞可以是人或非人細胞。優(yōu)選的宿主細胞是哺乳動物細胞。哺乳動物宿主細胞的優(yōu) 選例子包括而不限于人胚腎細胞(Graham FL等人,J. Gen. Virol. 36:59-74)、MRC5人成纖 維細胞、983M人黑色素瘤細胞、MDCK犬腎細胞、RF培養(yǎng)的從Sprague-Dawley大鼠分離的大 鼠肺成纖維細胞、B16BL6鼠黑色素瘤細胞、P815鼠肥大細胞瘤細胞、MT1 A2鼠乳房腺癌細 胞、PER: C6細胞(Leiden、荷蘭)和中國倉鼠卵巢(CH0)細胞或細胞系(Puck等人,1958, J. Exp. Med. 108:945-955)。
[0187] 在一個具體的優(yōu)選實施方案中,宿主細胞是中國倉鼠卵巢(CH0)細胞或細胞 系。合適的 CH0 細胞系例如包括 CH〇-S(Invitrogen,Carlsbad,CA,美國)、CHO K1 (ATCC CCL-61)、CH0 pro3-、CH0 DG44、CH0 P12 或 dhfrTHO 細胞系 DUK-BII(Chasin 等 人,PNAS 77, 1980, 4216-4220)、DUXBI 1 (Simonsen 等人,PNAS 80, 1983, 2495-2499)、或 CH0-K1SV (Lonza,巴賽爾,瑞士)。
[0188] 在又一個方面,本公開提供用于表達多肽的體外方法,所述方法包括用如上文描 述的表達盒或表達載體轉(zhuǎn)染宿主細胞并回收多肽。該多肽優(yōu)選地是異源的,更優(yōu)選地是人 多肽。
[0189] 根據(jù)本發(fā)明為了將表達盒或表達載體轉(zhuǎn)染入宿主細胞,可以使用任何轉(zhuǎn)染技術, 如本領域熟知的那些,例如電穿孔法、磷酸鈣共沉淀法、DEAE-葡聚糖轉(zhuǎn)染法、脂質(zhì)體轉(zhuǎn)染 法,適當時用于給定宿主細胞類型。應當指出,用本發(fā)明表達盒或表達載體轉(zhuǎn)染的宿主細胞 應當解釋為是瞬時或穩(wěn)定轉(zhuǎn)染的細胞系。因此,根據(jù)本發(fā)明,本發(fā)明表達盒或表達載體可 以按附加型方式維持,即瞬時轉(zhuǎn)染的,或可以穩(wěn)定整合在宿主細胞的基因組中,即穩(wěn)定轉(zhuǎn)染 的。
[0190] 瞬時轉(zhuǎn)染以不采用針對具有選擇標記的載體的任何選擇壓力為特征。在轉(zhuǎn)染后通 常持續(xù)2直至10日的瞬時表達實驗中,轉(zhuǎn)染的表達盒或表達載體作為附加型元件維持并也 不整合至基因組中。即,轉(zhuǎn)染的DNA通常不整合至宿主細胞基因組中。宿主細胞傾向于丟 失轉(zhuǎn)染的DNA并且當培養(yǎng)瞬時轉(zhuǎn)染的細胞匯集物時在群體中長滿轉(zhuǎn)染的細胞。因此表達在 緊鄰轉(zhuǎn)染后的時間段中最強烈并且隨時間減少。優(yōu)選地,將本發(fā)明的瞬時轉(zhuǎn)染子理解為在 選擇壓力不存在的情況下在細胞培養(yǎng)物中維持直至轉(zhuǎn)染后2至10日時間的細胞。
[0191] 在本發(fā)明的優(yōu)選實施方案中,宿主細胞例如CH0宿主細胞用本發(fā)明的表達盒或表 達載體穩(wěn)定轉(zhuǎn)染。穩(wěn)定轉(zhuǎn)染意指新引入的外來DNA如載體DNA被摻入基因組DNA中,通常 借助隨機非同源重組事件??梢酝ㄟ^選擇其中在整合入宿主細胞的DNA之后載體序列已經(jīng) 被擴增的細胞系,增加載體DNA的拷貝數(shù)以及同時增加基因產(chǎn)物的量。因此,可能的是當暴 露于用于擴增基因的選擇壓力進一步增加時,這種穩(wěn)定整合在CH0細胞中產(chǎn)生雙倍微小染 色體。另外,穩(wěn)定轉(zhuǎn)染可以導致丟失與重組基因產(chǎn)物表達不直接相關的載體序列部分,例如 當基因組整合時變得多余的細菌拷貝數(shù)控制區(qū)。因此,轉(zhuǎn)染的宿主細胞已經(jīng)將表達盒或表 達載體的至少部分或不同部分整合至基因組中。
[0192] 在又一個方面,本公開提供如上文描述的表達盒或表達載體用于從哺乳動物宿主 細胞表達異源多肽的用途,特別是如上文描述的表達盒或表達載體用于從哺乳動物宿主細 胞體外表達異源多肽的用途。
[0193] 可以根據(jù)本領域技術人員已知的方法實施蛋白質(zhì)的表達和回收。
[0194] 為了表達多肽,使用如上文描述的表達盒或表達載體的真核GAPDH啟動子下游和 /或上游非翻譯性基因組DNA序列和如上文描述的宿主細胞并且它們通常是相同來源的。 令人驚訝地已經(jīng)發(fā)現(xiàn)如果表達盒或表達載體的真核GAPDH啟動子下游和/或上游的非翻譯 性基因組DNA序列和宿主細胞是不同來源的,例如,如果在CHO細胞中使用人的真核GAPDH 啟動子下游和/或上游的DNA序列,則獲得表達的增加。
[0195] 在又一個方面,本公開提供如上文描述的表達盒或表達載體制備用于治療疾病的 藥物的用途。
[0196] 在又一個方面,本公開提供如上文描述的表達盒或表達載體,其用作治療疾病的 藥物。
[0197] 在又一個方面,本公開提供如上文描述的表達盒或表達載體,其用于基因療法。 實施例
[0198] 實施例1 :表達載體的克?。?br>
[0199] I.材料和方法
[0200] I. 1質(zhì)粒構建體
[0201] I.1.1.LB 培養(yǎng)板
[0202] 將 500ml 水與 16g LB 瓊脂(Invitrogen,Carlsbad, CA,美國)混合并煮沸(1 升 LB含有10g胰蛋白胨、5g酵母提取物和10g NaCl)。在冷卻下來后,將相應的抗生素添加至 溶液,所述溶液隨后鋪板(氨節(jié)青霉素平板為100 μ g/ml和卡那霉素平板為50 μ g/ml)。
[0203] I. 1. 2.聚合酶鏈反應(PCR)
[0204] 全部 PCR 均使用 50 μ 1 終體積中的 1 μ ldNTP (每種 dNTP 為 10mM ;Invitrogen, Carlsbad, CA,美國)、2 單位 Phusi〇H? DNA 聚合酶(Finnzymes 0y, Espoo,芬蘭)、25nmol 引物 A (Mycrosynth,Balgach,瑞士)、25nmol 引物 B (Mycrosynth,Balgach,瑞士)、10 μ 15X HF 緩沖劑(7.5mM MgCl2,F(xiàn)innzymes,Espoo,芬蘭)、1·5μ1 二甲基亞諷(DMS0,F(xiàn)innzymes, Espoo,芬蘭)和1-3 μ 1模板(1-2 μ g)進行。表1中列出使用的全部引物。
[0205] 通過在98°C初始變性3分鐘啟動PCR,隨后是35個循環(huán):在98°C變性30秒,在引 物特異性溫度(根據(jù)CG含量)退火30秒和在72 °C延長2分鐘。在72 °C進行最終延長10 分鐘,之后冷卻和保持在4 C。
[0206] 表1 :PCR中使用的引物的總結(jié)。GAPDH :甘油醛3-磷酸脫氫酶序列,5' :上游序列, 3:下游序列。引物GlnPrll72中引入"T"(加下劃線)以避免引物二聚體形成。
[0207]
【權利要求】
1. 一種表達盒,其包含啟動子、編碼多肽的多核苷酸序列和表達增強元件,其中表達增 強元件包含真核甘油醛3-磷酸脫氫酶(GAPDH)啟動子下游的非翻譯性基因組DNA序列, 其中由多核苷酸序列編碼的多肽不是GAPDH,并且其中真核GAPDH啟動子下游的非翻譯性 基因組DNA序列始于跨越核苷酸位置約+1至核苷酸位置約+7000的區(qū)域內(nèi)部,其中核苷酸 位置是相對于GAPDH mRNA轉(zhuǎn)錄起始的,并且其中真核GAPDH啟動子下游的非翻譯性基因組 DNA序列的長度是約100至約15000個核苷酸。
2. 根據(jù)權利要求所述1的表達盒,其中表達盒還包含真核GAPDH啟動子上游的非翻譯 性基因組DNA序列,其中真核GAPDH啟動子上游的非翻譯性基因組DNA序列始于跨越約真 核GAPDH啟動子的5'末端至核苷酸位置約-3500的區(qū)域內(nèi)部,其中核苷酸位置是相對于 GAPDH mRNA轉(zhuǎn)錄起始,并且其中真核GAPDH啟動子上游的非翻譯性基因組DNA序列的長度 是約100至約15000個核苷酸。
3. -種表達盒,其包含啟動子、編碼多肽的多核苷酸序列和真核GAPDH啟動子上游 的非翻譯性基因組DNA序列,其中由多核苷酸序列編碼的多肽不是GAPDH,并且其中真核 GAPDH啟動子上游的非翻譯性基因組DNA序列始于跨越約真核GAPDH啟動子的5'末端至核 苷酸位置約-3500的區(qū)域內(nèi)部,其中核苷酸位置是相對于GAPDH mRNA轉(zhuǎn)錄起始的,其中真 核GAPDH啟動子上游的非翻譯性基因組DNA序列的長度是100至約15000個核苷酸,條件 是表達盒不包含真核GAPDH啟動子或其片段。
4. 根據(jù)權利要求3所述的表達盒,其中表達盒還包含真核GAPDH啟動子下游的非翻譯 性基因組DNA序列,其中真核GAPDH啟動子下游的非翻譯性基因組DNA序列始于跨越核苷 酸位置約+1至核苷酸位置約+7000的區(qū)域內(nèi)部,其中核苷酸位置是相對于GAPDH mRNA轉(zhuǎn) 錄起始的,并且其中真核GAPDH啟動子下游的非翻譯性基因組DNA序列的長度是約100至 約15000個核苷酸。
5. 根據(jù)權利要求1至4中任一項所述的表達盒,其中真核GAPDH啟動子下游和/或上 游的非翻譯性基因組DNA序列未與編碼多肽的多核苷酸序列有效連接。
6. 根據(jù)權利要求1至4中任一項所述的表達盒,其中表達盒還包含多聚腺苷化位點。
7. 根據(jù)權利要求1或4所述的表達盒,其中真核GAPDH啟動子下游的非翻譯性基因組 DNA序列的長度是約10個核苷酸并且在其最大情況下延伸至IFF01基因的倒數(shù)第二內(nèi)含子 或延伸至其部份。
8. 根據(jù)權利要求1或4所述的表達盒,其中真核GAPDH啟動子下游的非翻譯性基因組 DNA序列始于真核GAPDH多聚腺苷化位點的下游并且其中真核GAPDH啟動子下游的非翻譯 性基因組DNA序列的長度是至少約100個核苷酸并且在其最大情況下延伸至IFF01基因的 倒數(shù)第二內(nèi)含子。
9. 根據(jù)權利要求2所述的表達盒,其中真核GAPDH啟動子上游的非翻譯性基因組DNA 序列的長度是至少約100個核苷酸并且在其最大情況下延伸至NCAPD2基因的起始密碼子。
10. 根據(jù)權利要求2所述的表達盒,其中真核GAPDH啟動子上游的非翻譯性基因組DNA 序列的長度是至少約100個核苷酸并且在其最大情況下延伸至NCAPD2基因的倒數(shù)第三內(nèi) 含子。
11. 根據(jù)權利要求3所述的表達盒,其中真核GAPDH啟動子上游的非翻譯性基因組DNA 序列的長度是至少100個核苷酸并且在其最大情況下延伸至NCAPD2基因的起始密碼子。
12. 根據(jù)權利要求3所述的表達盒,其中真核GAPDH啟動子上游的非翻譯性基因組DNA 序列的長度是至少100個核苷酸并且在其最大情況下延伸至NCAPD2基因的倒數(shù)第三內(nèi)含 子。
13. 根據(jù)權利要求1至4中任一項所述的表達盒,其中真核GAPDH啟動子下游和/或上 游的非翻譯性基因組DNA序列是哺乳動物源的。
14. 根據(jù)權利要求13所述的表達盒,其中真核GAPDH啟動子下游和/或上游的非翻譯 性基因組DNA序列是嚙齒類源或人源的。
15. 根據(jù)權利要求1或4所述的表達盒,其中真核GAPDH啟動子下游的非翻譯性基因組 DNA序列包含選自SEQ ID NOs:8和21的核苷酸序列或其片段。
16. 根據(jù)權利要求1或4所述的表達盒,其中真核GAPDH啟動子下游的非翻譯性基因組 DNA序列包含與選自SEQ ID NOs:8和21的核苷酸序列或其片段互補的核苷酸序列。
17. 根據(jù)權利要求1或4所述的表達盒,其中真核GAPDH啟動子下游的非翻譯性基因組 DNA序列包含與選自SEQ ID NOs:8和21的核苷酸序列或其片段相同至少80%的核苷酸序 列。
18. 根據(jù)權利要求2或3所述的表達盒,其中真核GAPDH啟動子上游的非翻譯性基因組 DNA序列包含選自 SEQ ID 吣:7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28的 核苷酸序列或其片段。
19. 根據(jù)權利要求18所述的表達盒,其中選自SEQ ID N0s:7、9、10、ll、12、13、14、15、 16、20、22、23、24、25、26、27和28的核苷酸序列或其片段包含5個或更少的核酸修飾。
20. 根據(jù)權利要求2或3所述的表達盒,其中真核GAPDH啟動子上游的非翻譯性基因組 DNA序列包含與選自 SEQ ID 吣:7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28 的核苷酸序列或其片段互補的核苷酸序列。
21. 根據(jù)權利要求2或3所述的表達盒,其中真核GAPDH啟動子上游的非翻譯性基因組 DNA序列包含與選自 SEQ ID 吣:7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28 的核苷酸序列或其片段相同至少80%的核苷酸序列。
22. 根據(jù)權利要求1至4中任一項所述的表達盒,其中啟動子和編碼多肽的多核苷酸序 列是有效連接的。
23. 根據(jù)權利要求1或4所述的表達盒,其中真核GAPDH啟動子下游的非翻譯性基因組 DNA序列以與編碼多肽的多核苷酸序列相同的方向定向。
24. 根據(jù)權利要求1或4所述的表達盒,其中真核GAPDH啟動子下游的非翻譯性基因組 DNA序列相對于編碼多肽的多核苷酸序列以相反方向定向。
25. 根據(jù)權利要求2或3所述的表達盒,其中真核GAPDH啟動子上游的非翻譯性基因組 DNA序列以與編碼多肽的多核苷酸序列相同的方向定向。
26. 根據(jù)權利要求2或3所述的表達盒,其中真核GAPDH啟動子上游的非翻譯性基因組 DNA序列相對于編碼多肽的多核苷酸序列以相反方向定向。
27. 根據(jù)權利要求1至4中任一項所述的表達盒,其中啟動子選自SV40啟動子、MPSV 啟動子、小鼠 CMV、人tk、人CMV、大鼠 CMV、人EF1 α、中國倉鼠 EF1 α、人GAPDH、雜合啟動子, 所述雜合啟動子包括MYC、HYK和CX啟動子。
28. 根據(jù)權利要求1至4中任一項所述的表達盒,其中多肽選自抗體、抗體片段或抗體 衍生物。
29. 根據(jù)權利要求6所述的表達盒,其中多聚腺苷化位點選自BGH poly㈧和 SV40poly(A)〇
30. 根據(jù)權利要求1至4中任一項所述的表達盒,還包含選自額外的啟動子、增強子、轉(zhuǎn) 錄控制元件和選擇標記的遺傳元件。
31. 根據(jù)權利要求30所述的表達盒,其中遺傳元件是選擇標記,其中在編碼選擇標記 的多核苷酸序列中所含的CpG位點的含量是45或更小。
32. 表達載體,其包含根據(jù)權利要求1至29中任一項所述的表達盒。
33. 表達載體,其依次包含: a) 真核GAPDH啟動子上游和/或下游的非翻譯性基因組DNA序列 b) 啟動子 c) 編碼多肽的多核苷酸序列 d) 多聚腺苷化位點 e) 增強子 f) 真核GAPDH啟動子下游和/或上游的非翻譯性基因組DNA序列,或 a) 真核GAPDH啟動子上游和/或下游的非翻譯性基因組DNA序列 b) 增強子 c) 啟動子 d) 編碼多肽的多核苷酸序列 e) 多聚腺苷化位點 f) 真核GAPDH啟動子下游和/或上游的非翻譯性基因組DNA序列,或 a) 增強子 b) 真核GAPDH上游和/或下游的非翻譯性基因組DNA序列 c) 啟動子 d) 編碼多肽的多核苷酸序列 e) 多聚腺苷化位點 f) 真核GAPDH下游和/或上游的非翻譯性基因組DNA序列, 其中包含增強子是任選的,并且其中由多核苷酸序列編碼的多肽不是GAPDH,并且其中 真核GAPDH啟動子下游的非翻譯性基因組DNA序列始于跨越核苷酸位置約+1至核苷酸位 置約+7000的區(qū)域內(nèi)部,其中核苷酸位置是相對于GAPDH mRNA轉(zhuǎn)錄起始的,并且其中真核 GAPDH啟動子下游的非翻譯性基因組DNA序列的長度是約100至約15000個核苷酸并且其 中真核GAPDH啟動子上游的非翻譯性基因組DNA序列始于跨越約真核GAPDH啟動子的5'末 端至核苷酸位置約-3500的區(qū)域內(nèi)部,其中核苷酸位置是相對于GAPDH mRNA轉(zhuǎn)錄起始的, 并且其中真核GAPDH啟動子上游的非翻譯性基因組DNA序列的長度是約100至約15000個 核苷酸,條件是如果a)或b)是真核GAPDH上游的非翻譯性基因組DNA序列,則f)是真核 GAPDH下游的非翻譯性基因組DNA序列,并且如果a)或b)是真核GAPDH下游的非翻譯性基 因組DNA序列,則f)是真核GAPDH上游的非翻譯性基因組DNA序列。
34. 根據(jù)權利要求32或33所述的表達載體,其中表達載體還包含選自額外的啟動子、 增強子,轉(zhuǎn)錄控制單元、復制起點和選擇標記的遺傳元件。
35. 根據(jù)權利要求32或33所述的表達載體,其中表達載體還包含復制起點和選擇標 記,其中表達載體的編碼復制起點和選擇標記的多核苷酸序列中所含的CpG位點的含量是 200或更小。
36. 宿主細胞,其包含根據(jù)權利要求1至31中任一項所述的表達盒或根據(jù)權利要求32 至35中任一項所述的表達載體。
37. 根據(jù)權利要求1至31中任一項所述的表達盒或根據(jù)權利要求32至35中任一項所 述的表達載體,用于作為用于治療疾病的藥物。
38. 根據(jù)權利要求1至31中任一項所述的表達盒或根據(jù)權利要求32至35中任一項所 述的表達載體,用于基因療法。
39. 用于表達多肽的體外方法,包括用根據(jù)權利要求1至31中任一項所述的表達盒或 根據(jù)權利要求32至35中任一項所述的表達載體轉(zhuǎn)染宿主細胞并回收多肽。
40. 根據(jù)權利要求39所述的方法,其中將表達盒或表達載體是穩(wěn)定轉(zhuǎn)染。
41. 根據(jù)權利要求39所述的方法,其中將表達盒或表達載體是瞬時轉(zhuǎn)染。
42. 根據(jù)權利要求1至31中任一項所述的表達盒或根據(jù)權利要求32至35中任一項所 述的表達載體的用途,用于從哺乳動物宿主細胞表達異源多肽。
【文檔編號】C12N15/09GK104093834SQ201280069001
【公開日】2014年10月8日 申請日期:2012年12月5日 優(yōu)先權日:2011年12月7日
【發(fā)明者】D·呂舍爾, C·埃比謝爾-古米, P·莫萊迪, M·博特施格爾 申請人:格蘭馬克藥品股份有限公司