亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于提高的蛋白或肽表達的人工核酸分子的制作方法

文檔序號:467105閱讀:274來源:國知局
用于提高的蛋白或肽表達的人工核酸分子的制作方法
【專利摘要】本發(fā)明涉及一種人工核酸分子,其包含至少一個來源于TOP基因的5’UTR元件,至少一個可讀框,和優(yōu)選至少一個組蛋白莖環(huán)。任選地,所述人工核酸分子可以進一步包含,例如,聚腺苷酸序列,聚腺苷酸化信號,和/或3’UTR。本發(fā)明還涉及所述人工核酸分子在基因治療和/或基因接種中的應(yīng)用。
【專利說明】用于提高的蛋白或肽表達的人工核酸分子
[0001] 本發(fā)明涉及人工核酸分子,其包含來源于TOP基因的5'UTR的5'UTR元件,可讀 框,以及任選的組蛋白莖環(huán),3'UTR元件,聚腺苷酸序列和/或聚腺苷酸化信號。本發(fā)明還 涉及包含來源于TOP基因的5'UTR的5'UTR元件的載體,涉及包含所述人工核酸分子或所 述載體的藥物組合物,并且涉及包含所述人工核酸分子、所述載體和/或所述藥物組合物 的試劑盒,優(yōu)選用于基因治療和/或基因接種領(lǐng)域中。
[0002] 基因治療和基因接種屬于最有希望并且發(fā)展快速的現(xiàn)代醫(yī)學(xué)方法。它們可以為非 常多種類的疾病的治療提供高度特異性的和個體性的選擇。具體地,遺傳病以及自身免疫 性疾病、癌癥或腫瘤相關(guān)的疾病和炎性病可以是所述治療方法的主題。此外,還考慮通過這 些方法預(yù)防此類疾病的(早期)發(fā)作。
[0003] 基因治療的主要觀念上的道理是正確調(diào)控與具體疾病的病理條件相關(guān)的受損的 基因表達。病理上改變的基因表達可能導(dǎo)致必需基因產(chǎn)物的缺少或過量產(chǎn)生,例如,信號傳 導(dǎo)因子,如激素,看家因子,代謝酶,結(jié)構(gòu)蛋白等。改變的基因表達可能不僅是由于轉(zhuǎn)錄和/ 或翻譯的錯誤調(diào)節(jié),而且是由于在編碼特定蛋白的ORF內(nèi)的突變導(dǎo)致。病理性突變可能由 例如染色體變異、或由更特異性的突變?nèi)琰c突變或移碼突變引起,所有這些導(dǎo)致有限的功 能性,并且潛在地導(dǎo)致基因產(chǎn)物功能的完全喪失。然而,如果突變影響編碼參與細胞的轉(zhuǎn)錄 或翻譯機制的蛋白的基因,則還可能發(fā)生轉(zhuǎn)錄或翻譯的錯誤調(diào)節(jié)。所述突變可能導(dǎo)致原本 是功能性的基因的病理性上調(diào)或下調(diào)。編碼展現(xiàn)出這樣的調(diào)節(jié)功能的基因產(chǎn)物的基因可以 是,例如,轉(zhuǎn)錄因子,信號受體,信使蛋白等。然而,在特定情形中,此類編碼調(diào)節(jié)性蛋白的基 因的功能喪失可能通過人為引入在所受損的基因產(chǎn)物的更下游起作用的其他因子而逆轉(zhuǎn)。 此類基因缺陷還可以通過替換受影響的基因本身的基因治療而得到補償。
[0004] 基因接種允許激發(fā)針對所選的抗原的需要的免疫應(yīng)答,所述所選的抗原如細菌表 面特有的成分,病毒顆粒,腫瘤抗原等。通常,接種是現(xiàn)代醫(yī)學(xué)的重大成就之一。然而,目前 僅對較少量的疾病存在有效的疫苗。因此,每年仍有數(shù)百萬人受不能通過接種預(yù)防的感染 的影響。
[0005] -般地,疫苗可以細分為"第一代"、"第二代"和"第三代"疫苗。"第一代"疫苗典 型地是全生物體疫苗。其實基于活的和減毒的或殺滅的病原體,例如,病毒、細菌等?;畹?和減毒疫苗的主要缺陷是回復(fù)為危脅生命的變體的危險。因此,盡管經(jīng)過減毒,此類病原體 可能仍然固有地攜帶無法預(yù)測的危險。殺滅的病原體可能不如產(chǎn)生特異性免疫應(yīng)答所需要 的那樣有效。為了使這些危險最小化,開發(fā)了"第二代"疫苗。典型地,這些是由來源于病 原體的定義的抗原或重組蛋白成分組成的亞單位疫苗。
[0006] 基因疫苗,S卩,用于基因接種的疫苗,通常理解為"第三代"疫苗。其典型地由遺 傳改造的核酸分子組成,所述遺傳改造的核酸分子允許病原體或腫瘤抗原特有的肽或蛋白 (抗原)在體內(nèi)表達。基因疫苗在施用給患者且被感受態(tài)細胞攝入后表達。施用的核酸的 表達導(dǎo)致編碼的蛋白的產(chǎn)生。當(dāng)這些蛋白被患者的免疫系統(tǒng)識別為外源物時,引發(fā)免疫應(yīng) 答。
[0007] 從上述可以看出,基因治療和基因接種這兩種方法都主要是基于對患者施用核酸 分子和隨后所編碼的遺傳信息的轉(zhuǎn)錄和/或翻譯。備選地,基因接種或基因治療還可以包 括這樣的方法:所述方法包括從待治療的患者分離特定的體細胞,隨后體外轉(zhuǎn)染所述細胞, 并且將處理的細胞重新施用至所述患者中。
[0008] 在基因治療或基因接種的情形中,DNA以及RNA可以用作用于施用的核酸分子。已 知DNA相對穩(wěn)定并且易于處理。然而,使用DNA帶有施用的DNA片段不需要的插入到患者 基因組中潛在地導(dǎo)致受損的基因功能喪失的危險。另一個危險是,出現(xiàn)不需要的抗-DNA抗 體的產(chǎn)生。另一種缺陷是施用DNA及其轉(zhuǎn)錄/翻譯時可獲得的編碼的肽或蛋白的有限的表 達水平。其他的原因中,所施用的DNA的表達水平將取決于調(diào)節(jié)DNA轉(zhuǎn)錄的特異性轉(zhuǎn)錄因 子的存在。不存在所述因子時,DNA轉(zhuǎn)錄將不會產(chǎn)生滿意量的RNA。結(jié)果,所獲得的翻譯的 肽或蛋白的水平是有限的。
[0009] 使用RNA而不是使用DNA用于基因治療或基因接種,不需要的基因組整合和 抗-DNA抗體的產(chǎn)生的危險減至最小或者得以避免。然而,認(rèn)為RNA是相當(dāng)不穩(wěn)定的分子物 種,其可以容易地被遍在的RNA酶所降解。
[0010] 在體內(nèi),RNA降解有助于RNA半衰期時間的調(diào)節(jié)。認(rèn)為并證明這種作用精細 調(diào)節(jié)對真核基因表達的調(diào)控(Friedel等人,Conservedprinciplesofmammalian transcriptionalregulationrevealedbyRNAhalf-life(RNA半衰期揭不的哺乳動物 轉(zhuǎn)錄調(diào)節(jié)的守恒原理),NucleicAcidResearch(核酸研究),2009,1-12)。因此,每種天 然存在的mRNA具有其各自的半衰期,這取決于該mRNA所來源的基因。這有助于對該基因 表達水平的調(diào)節(jié)。不穩(wěn)定的RNAs對在不同時間點實現(xiàn)瞬時基因表達是重要的。然而,長期 存在的RNAs可能與不同蛋白的累積或基因的連續(xù)表達有關(guān)。在體內(nèi),mRNAs的半衰期還可 能取決于環(huán)境因素,諸如激素治療,例如,如已經(jīng)對胰島素樣生長因子I、肌動蛋白和白蛋白 mRNA所表明的那樣(Johnson等,NewlysynthesizedRNA!Simultaneousmeasurementin intactcellsoftranscriptionratesandRNAstabilityofinsulin-likegrowth factorI,actin,andalbuminingrowthhormone-stimulatedhepatocytes(剛合成 的RNA:在生長激素刺激的肝細胞中在完整的細胞中同時測量胰島素樣生長因子I、肌動蛋 白和白蛋白的轉(zhuǎn)錄速率和RNA穩(wěn)定性),Proc.Natl.Acad.Sci.(美國國家科學(xué)院學(xué)報), Vol. 88,pp.5287-5291,1991)。
[0011] 對于基因治療和基因接種,通常需要穩(wěn)定的RNA。一方面,這是由于由RNA序列編 碼的產(chǎn)物應(yīng)該在體內(nèi)積聚的事實。另一方面,當(dāng)制備成合適的劑型、在其存儲過程中以及在 施用時,RNA必須保持其結(jié)構(gòu)和功能完整性。因此,投入相當(dāng)多的關(guān)注來提供用于基因治療 或基因接種的穩(wěn)定的RNA分子,以防止其被過早的降解或衰變。
[0012] 已經(jīng)報道核酸分子的G/C-含量可能影響其穩(wěn)定性。因此,與包含大量的腺嘌呤 (A)和胸腺嘧啶(T)或尿嘧啶(U)核苷酸的核酸相比,包含增加量的鳥嘌呤(G)和/或胞嘧 啶(C)殘基的核酸在功能上更穩(wěn)定。在這種情形中,W002/098443提供了包含通過在翻譯 區(qū)序列修飾而穩(wěn)定的mRNA的藥物組合物。所述序列修飾利用遺傳密碼的簡并性。因此,含 有較不優(yōu)選的核苷酸組合(關(guān)于RNA穩(wěn)定性較不優(yōu)選)的密碼子可以被不改變編碼的核酸 序列的備用密碼子置換。這種RNA穩(wěn)定方法受到提供不允許留下需要的氨基酸序列的空隙 的每種單一RNA分子的特定的核苷酸序列的限制。此外,所述方法限于RNA的編碼區(qū)。
[0013] 作為RNA穩(wěn)定的備選選擇,已經(jīng)發(fā)現(xiàn)天然存在的真核mRNA分子包含特有的穩(wěn)定元 件。例如,其可以在其5' -端(5'UTR)和/或在其3' -端(3'UTR)包含所謂的非翻譯區(qū) (UTR)以及其他結(jié)構(gòu)特征,如5'-帽結(jié)構(gòu)或3'-聚腺苷酸尾。5'UTR和3'UTR二者典型地 由基因組DNA轉(zhuǎn)錄,并且,因此,是不成熟mRNA的元件。成熟mRNA特有的結(jié)構(gòu)特征,諸如 5' -帽和3' -聚腺苷酸尾(也稱為聚腺苷酸尾或聚腺苷酸序列),在mRNA加工過程中通常 添加至轉(zhuǎn)錄的(不成熟的)mRNA。
[0014] 3'-聚腺苷酸尾是添加至轉(zhuǎn)錄的mRNA的3'-端的腺嘌呤核苷酸的單一序列片 段。其可以包含多至約400個腺嘌呤核苷酸。發(fā)現(xiàn)所述3'-聚腺苷酸尾的長度是個體 mRNA穩(wěn)定性的潛在的關(guān)鍵元素。
[0015] 幾乎所有的真核mRNAs都以通過遍在的切割/聚腺苷酸機制添加至其3'端的所 述聚腺苷酸序列作為末端。在3'端存在聚腺苷酸序列是真核mRNAs最可辨識的特征之一。 在切割后,除了復(fù)制依賴性組蛋白轉(zhuǎn)錄物之外,大部分前mRNAs獲得聚腺苷酸化的尾。在這 一清形中,3'端加工是促使mRNAs從細胞核向細胞質(zhì)轉(zhuǎn)運并且影響mRNAs的穩(wěn)定性和翻譯 的核共轉(zhuǎn)錄過程。該3'端形成以由切割/聚腺苷酸化機制指導(dǎo)的兩步反應(yīng)發(fā)生,并且取決 于兩種序列元件在mRNA前體(前mRNAs)中的存在:高度保守的六核苷酸AAUAAA(聚腺苷 酸化信號)和下游富含G/U的序列。第一步,前mRNAs在這兩種元件之間被切割。與第一 步緊密偶聯(lián)的第二步,剛形成的3'端通過添加由200-250個腺苷酸組成的聚腺苷酸序列 而延伸,這影響后續(xù)mRNA代謝的所有方面,包括mRNA輸出、穩(wěn)定性和翻譯(Dominski,Z.和 W.F.MarzlufT(2007),Gene(基因)396 (2) :373-90.)。
[0016] 該法則唯一已知的例外是復(fù)制依賴性組蛋白mRNAs,其以組蛋白莖環(huán)而不是聚 腺苷酸序列終止。示例性的組蛋白莖環(huán)序列記述在Lopez等人(DdvilaL6pez,M.,&Samuelsson,T. (2008),RNA(NewYork,N.Y. ),14(1),1-10.doi:10. 1261/rna. 782308.)中。 [0017] 組蛋白前mRNAs中的莖環(huán)典型地接著富含嘌呤的序列,其稱為組蛋白下游元件 (HDE)。這些前mRNAs在細胞核中在該莖環(huán)下游的大約5個核苷酸處由單次內(nèi)切核酸水解 切割而進行加工,該單次內(nèi)切核酸水解切割由U7snRNP通過U7snRNA與HDE的堿基配對進 行催化。
[0018] 由于需要將剛合成的DNA包裝成染色質(zhì),組蛋白合成與細胞周期相適應(yīng)地進行調(diào) 節(jié)。在S期過程中增加的組蛋白類蛋白(histoneproteins)合成通過組蛋白基因的轉(zhuǎn)錄 激活以及組蛋白mRNA水平的轉(zhuǎn)錄后調(diào)控而實現(xiàn)。這可能表明,組蛋白莖環(huán)對于組蛋白表達 調(diào)節(jié)的所有轉(zhuǎn)錄后步驟都是重要的。其是有效加工、mRNA輸出到細胞質(zhì)中、負(fù)載到多核糖 體上和對mRNA穩(wěn)定性的調(diào)節(jié)所必需的。
[0019] 在上述情形中,鑒定了一種32kDa的蛋白,其在細胞核和細胞質(zhì)中在組蛋白信使 的3'端與組蛋白莖環(huán)相締合。該莖環(huán)結(jié)合蛋白(SLBP)的表達水平是細胞周期調(diào)節(jié)的,并且 在S期最高,此時組蛋白mRNA水平增加。SLBP是U7snRNP對組蛋白前mRNA的有效的3'端 加工所必需的。在加工完成后,SLBP保持與成熟的組蛋白mRNAs的末端的莖環(huán)締合,并且在 刺激其在細胞質(zhì)中翻譯成組蛋白類蛋白。(Dominski,Z.和W.F.Marzluff(2007),Gene(基 因)396(2) :373-90)。有趣的是,SLBP的RNA結(jié)合結(jié)構(gòu)域在后生動物和原生動物中都是 保守的(DdvilaL6pez,M.,&Samuelsson,T. (2008),RNA(紐約,N.Y. ),14(1),1-10.doi: 10. 1261/rna. 782308),并且其能夠表明,其與組蛋白莖環(huán)序列的結(jié)合取決于莖環(huán)結(jié)構(gòu),并 且最小的結(jié)合位點包含所述莖環(huán)的至少3個5'核苷酸和2個3'核苷酸(Pandey,N.B.,等 人?(1994),Molecular and Cellular Biology(分子和細胞生物學(xué)),14(3) ,1709-1720 和Williams,A. S.,& Marzluff,W.F.,(1995),Nucleic Acids Research(核酸研究),23(4), 654-662.)。
[0020] 盡管組蛋白基因通常分類為"復(fù)制依賴性的",其產(chǎn)生末端是組蛋白莖環(huán)的mRNA, 或是"置換型的",其相反產(chǎn)生攜帶聚腺苷酸尾的mRNA,但是,在一些非常少見的情形中已經(jīng) 鑒定了天然存在的在其3'包含組蛋白莖環(huán)和聚腺苷酸或寡腺苷酸的mRNAs。Sanchez等人 使用熒光素酶作為報道蛋白在爪蟾(Xenopus)卵子發(fā)生過程中檢驗了附著在組蛋白mRNA 的組蛋白莖環(huán)的3'的天然存在的寡腺苷酸尾的作用,并且發(fā)現(xiàn)寡腺苷酸尾是在卵子發(fā)生過 程中使組蛋白mRNA沉默的翻譯抑制機制的活性部分,并且去除其是激活組蛋白mRNAs翻 譯的機制的一部分(Sanchez,R.和W.F.Marzluff(2004),MolCellBiol(分子細胞生物 學(xué))24(6) :2513-25)。
[0021] 此外,已經(jīng)使用編碼標(biāo)記蛋白a珠蛋白的人工構(gòu)建體研究了在前mRNA加工和 mRNA穩(wěn)定性水平上對復(fù)制依賴性組蛋白的調(diào)節(jié)的需要,這是利用與內(nèi)含子較少的組蛋 白基因相比珠蛋白基因含有內(nèi)含子的事實。對于這一目的,產(chǎn)生這樣的構(gòu)建體,其中a 珠蛋白編碼序列之后接著組蛋白莖環(huán)信號(組蛋白莖環(huán)之后接著組蛋白下游元件)和 聚腺苷酸化信號(Whitelaw,E.,等人?(1986).Nucleic Acids Research(核酸研究), 14(17),7059-7070.;Pandey, N. B., &Marzluff,ff.F.(1987).Molecular and Cellular Biology(分子和細胞生物學(xué)),7(12) ,4557-4559.;Pandey,N.B.,等人?(1990).Nucleic Acids Research(核酸研究),18 (11),3161-3170)。
[0022] 此外,表明a珠蛋白mRNA的3'UTR可能是a珠蛋白mRNA公知的穩(wěn)定性的 重要因素(Rodgers等人,Regulateda-globinmRNAdecayisacytoplasmicevent proceedingthrough3J-t〇-5Jexosome-dependentdecapping(調(diào)節(jié)的a珠蛋白mRNA衰減 是通過3' -至-5'外核體-依賴性脫帽進行的細胞質(zhì)事件),RNA,8,pp. 1526-1537, 2002)。 明顯地,a珠蛋白mRNA的3'UTR參與特定的核糖核蛋白復(fù)合物(S卩,a復(fù)合物)的形成,該 復(fù)合物的存在與體外mRNA穩(wěn)定性相關(guān)(Wang等人,AnmRNAstabilitycomplexfunctions withpoly(A)-bindingproteintostabilizemRNAinvitro(mRNA穩(wěn)定性復(fù)合物與聚腺 苷酸-結(jié)合蛋白一起作用在體外穩(wěn)定mRNA),MolecularandCellularbiology(分子和細 胞生物學(xué)),Vol19,No. 7,Julyl999,p. 4552-4560)。
[0023] 不考慮影響mRNA穩(wěn)定性的因素,靶細胞或組織對所施用的核酸分子的有效翻譯 對于使用核酸分子進行基因治療或基因接種的任何方法都是至關(guān)重要的。與穩(wěn)定性的調(diào)節(jié) 一起,大部分mRNAs的翻譯也受結(jié)構(gòu)特征如mRNAs、5' -帽和3' -聚腺苷酸尾的調(diào)節(jié)。在這 一情形中,已經(jīng)報道聚腺苷酸尾的長度可能也對翻譯效率起重要作用。然而,穩(wěn)定3'-元件 還可能對翻譯具有減弱作用。
[0024] 在5'UTR中可以發(fā)現(xiàn)其他可能對表達水平有影響的調(diào)節(jié)元件。例如,已經(jīng)報道, 特定蛋白的合成,例如,屬于翻譯機構(gòu)的蛋白,可以不僅在轉(zhuǎn)錄水平而且在翻譯水平上進 行調(diào)節(jié)。例如,由所謂的'TOP-基因'編碼的蛋白的翻譯可以通過翻譯抑制進行下調(diào)。此 處,術(shù)語'TOP-基因'涉及與特征在于在5'端存在TOP序列并且在大部分情形中通過生 長相關(guān)的翻譯調(diào)節(jié)的mRNA相對應(yīng)的基因(Iadevaia等人,Alltranslationelongation factorsandthee,f,andhsubunitsoftranslationinitiationfactor3areencoded by5'_terminaloligopyrimidine(TOP)mRNAs(所有翻譯延伸因子和翻譯起始因子3的e,f和h亞基都由5'-端寡嘧啶(TOP)mRNAs編碼);RNA,2008,14 :1730-1736)。在這一情形中, TOP序列-還稱為'5' -端寡嘧啶片段典型地由在帽位點的C殘基組成,接著是多至13 個或甚至更多個啼陡的未中斷的序列(Avni等人,VertebratemRNAswitha5'-terminal pyrimidinetractareCandidatesfortranslationalrepressioninquiescent cells!characterizationofthetranslationalcis-regulatoryelement(具有 5?-端 嘧啶片段的脊椎動物mRNAs是休眠細胞中翻譯抑制的候選物:翻譯順式調(diào)節(jié)元件的表征), MolecularandCellularBiology(分子和細胞生物學(xué)),1994,p. 3822-3833)。據(jù)報道 這些TOP序列存在于翻譯機制的多種mRNAs編碼成分中,并且負(fù)責(zé)由于生長停滯導(dǎo)致的 這些含有TOP的mRNAs的翻譯的選擇性抑制(Meyuhas,等人,TranslationalControlof RibosomalProteinmRNAsinEukaryotes(真核生物中核糖體蛋白mRNAs的翻譯控制), TranslationalControl(番羽譯控制)?ColdSpringHarborMonographArchive.Cold SpringHarborLaboratoryPress, 1996,p.363-388)。
[0025] 本發(fā)明的目的是提供可以適合用于基因治療和/或基因接種的核酸分子。具體 地,本發(fā)明的目的是提供人工核酸分子,如mRNA種類,其提供由所述人工核酸分子產(chǎn)生的 增加的蛋白生產(chǎn),優(yōu)選地其表現(xiàn)出增加的翻譯效率。本發(fā)明的另一個目的是提供編碼可以 適合在基因治療和/或基因接種中應(yīng)用的此類優(yōu)良的mRNA種類的核酸分子。本發(fā)明的另 一個目的是提供用于基因治療和/或基因接種的藥物組合物。總之,本發(fā)明的目的是提供 以成本有效且直接的途徑克服上文所討論的現(xiàn)有技術(shù)的缺點的改善的核酸種類。
[0026] 作為本發(fā)明的基礎(chǔ)的目的通過所要求的主題得以解決。
[0027] 為了清楚和可讀性,提供下述定義。對于這些定義提及的任意技術(shù)特征可以關(guān)于 本發(fā)明的每一個實施方案進行閱讀。在這些實施方案的情形中,可以特別提供另外的定義 和解釋。
[0028]適應(yīng)件免疫應(yīng)答:適應(yīng)件免疫應(yīng)答典型地理解為免疫系統(tǒng)的抗原特異件反應(yīng)???原特異性允許產(chǎn)生針對特定的病原體或病原體感染的細胞定制的反應(yīng)。啟動這些定制的 反應(yīng)的能力在機體中通常由"記憶細胞"維持。如果病原體感染機體多于一次,這些特異 性的記憶細胞用于迅速地將其消除。在這一情形中,適應(yīng)性免疫應(yīng)答的第一步是激活幼稚 (na_fve)抗原特異性T細胞或能夠通過抗原呈遞細胞誘導(dǎo)抗原特異性免疫應(yīng)答的不同的 免疫細胞。這發(fā)生在淋巴組織和器官中,幼稚(naive)T細胞不斷地通過所述淋巴組織和 器官??梢宰鳛榭乖蔬f細胞的三種細胞類型為樹突細胞、巨噬細胞和B細胞。這些細胞 的每一種在引發(fā)免疫應(yīng)答過程中具有不同的作用。樹突細胞可以通過吞噬或巨胞飲作用攝 入抗原,并且通過與例如外源抗原接觸而被刺激,以遷移到局部淋巴組織,在其中其分化為 成熟的樹突細胞。巨噬細胞消化顆??乖?,如細菌,并且被傳染劑或其他適當(dāng)?shù)拇碳ふT導(dǎo)表 達MHC分子。B細胞特有的通過其受體結(jié)合可溶性蛋白抗原并使其內(nèi)在化的能力對于誘導(dǎo) T細胞也可能是重要的。典型地,MHC-分子負(fù)責(zé)抗原向T細胞的呈遞。此處,呈遞MHC分子 上的抗原導(dǎo)致T細胞的激活,這誘導(dǎo)其增殖和分化成武裝的效應(yīng)T細胞。效應(yīng)T細胞最重要 的功能是通過CD8+細胞毒性T細胞殺死感染的細胞和通過Thl細胞激活巨噬細胞,二者一 起構(gòu)成細胞介導(dǎo)的免疫性,并且由Th2和Thl細胞激活的B細胞產(chǎn)生不同種類的抗體,由此 驅(qū)動體液免疫應(yīng)答。T細胞通過其T細胞受體識別抗原,其不直接識別抗原并與抗原結(jié)合, 相反而是識別短肽片段,例如,病原體來源的蛋白抗原的短肽片的,例如,所謂的表位,其與 在其他細胞表面上的MHC分子結(jié)合。
[0029] 適應(yīng)性免疫蓋^適應(yīng)性免疫系統(tǒng)主要致力于清除或防止病原性生長。其典型地 通過為脊椎動物免疫系統(tǒng)提供識別和記憶特定病原體(以產(chǎn)生免疫性)以及每次遇到所述 病原體時起始更強的攻擊的能力而調(diào)節(jié)適應(yīng)性免疫應(yīng)答。由于體細胞高度突變(加速的體 細胞突變的過程)和V(D)J重組(抗原受體基因片段的不可逆的基因重組),所述系統(tǒng)是高 度適應(yīng)性的。這一機制允許少數(shù)基因產(chǎn)生很多種不同的抗原受體,然后其獨特地在每個個 體淋巴細胞上表達。由于基因重排導(dǎo)致每個細胞DNA的不可逆的變化,那么所述細胞的所 有后代(子代)將遺傳編碼相同受體特異性的基因,包括是長期存在的特異性免疫性的關(guān) 鍵的記憶B細胞和記憶T細胞。
[0030]佐劑/佐劑成分:佐劑或佐劑成分在最廣泛意義卜.典型地是可以改奪(例如增 強)其他試劑(如藥物或疫苗)的作用的藥理學(xué)和/或免疫學(xué)試劑。其在廣義上解釋并且 是指廣譜物質(zhì)。典型地,這些物質(zhì)能夠增加抗原的免疫原性。例如,佐劑可以被先天性免疫 系統(tǒng)識別,并且,例如,可以激發(fā)先天性免疫應(yīng)答。"佐劑"典型地不激發(fā)適應(yīng)性免疫應(yīng)答。 在這種程度上,"佐劑"不能作為抗原。其作用模式不同于由抗原引發(fā)的導(dǎo)致適應(yīng)性免疫應(yīng) 答的作用。
[0031]抗原:在本發(fā)明的情形中,"抗原"典型地是指可以被免疫系統(tǒng)、優(yōu)選被適應(yīng)性免疫 系統(tǒng)識別的物質(zhì),并且能夠引發(fā)抗原特異性免疫應(yīng)答,例如,通過形成作為適應(yīng)性免疫應(yīng)答 的一部分的抗體和/或抗原特異性T細胞而引發(fā)。典型地,抗原可以是或可以包含可以由 MHC呈遞至T細胞的肽或蛋白。
[0032]人工核酸分子:人工核酸分子可以典型地理解為不是天然存在的核酸分子,例如, DNA或RNA。換言之,人工核酸分子可以理解為非天然核酸分子。所述核酸分子可以由于其 個體序列(其不是天然存在的)和/或由于其他修飾(例如,核苷酸的不是天然存在的結(jié) 構(gòu)修飾)而是非天然的。人工核酸分子可以是DNA分子、RNA分子或包含DNA和RNA部分 的雜化分子。典型地,人工核酸分子可以通過遺傳改造方法設(shè)計和/或產(chǎn)生,對應(yīng)于需要的 人工核苷酸序列(異源序列)。在這一情形中,人工序列通常是可能不是天然存在的序列, 艮P,其與野生型序列至少有一個核苷酸不同。術(shù)語'野生型'可以理解為天然存在的序列。 此外,術(shù)語'人工核酸分子'不限于意指'一種單一的分子',而是典型地理解為包含相同分 子的總體。因此,其可以涉及包含在等分部分中的多個相同的分子。
[0033]雙順反子RNA、多順反子RNA:雙順反子或多順反子RNA典型地是典型地可以具有 兩個(雙順反子)或更多個(多順反子)可讀框(ORF)的RNA,優(yōu)選mRNA。在這種情形中, 可讀框是可翻譯成肽或蛋白的密碼子序列。
[0034]載體/聚合物載體:在本發(fā)明的情形中,載體可以典型地是附沂另一種化合物(貨 物)的轉(zhuǎn)運和/或復(fù)合的化合物。聚合物載體典型地是由聚合物形成的載體。載體可以與 其貨物通過共價或非共價相互作用締合。載體可以將核酸,例如,RNA或DNA轉(zhuǎn)運至靶細胞。 對于一些實施方案,載體可以是陽離子成分。
[0035]陽離子成分:術(shù)語"陽離子成分"典型地是指帶電荷的分子,其在典型地為1-9的 pH值、優(yōu)選在等于或低于9的pH值(例如,5-9)、或等于或低于8的pH值(例如,5-8)、等 于或低于7 (例如5-7)的pH值,最優(yōu)選在生理pH值,例如,7. 3-7. 4,所述分子帶正電荷(陽 離子)。因此,陽離子成分可以是任意帶正電荷的化合物或聚合物,優(yōu)選在生理條件下、特別 是在體內(nèi)生理條件下帶正電荷的陽離子肽或蛋白。'陽離子肽或蛋白'可以包含至少一個帶 正電荷的氨基酸,或多于一個帶正電荷的氨基酸,例如,選自Arg,His,Lys或Orn。'聚陽離 子'成分也在該范圍內(nèi),其在給定條件下表現(xiàn)出多于一個正電荷。
[0036]5,_帽=5, _帽是一種實體,典型地是一種修飾的核苷酸實體,其通常在成熟mRNA 的5'-端'加帽'。5'-帽可以典型地由修飾的核苷酸形成,特別是由鳥嘌呤核苷酸的衍 生物形成。優(yōu)選地,5'-帽通過5' -5'-三磷酸鍵連接在5'-端。5'-帽可以被甲基化, 例如,m7GpppN,其中N是攜帶5' -帽的核酸的末端5'核苷酸,典型地是RNA的5' -端。5' 帽結(jié)構(gòu)的其他實例包括甘油基、倒置的脫氧脫堿基殘基(deoxyabasicresidue)(結(jié)構(gòu)部 分)、4',5'亞甲基核苷酸、1-(0_D-赤呋喃糖基)核苷酸、4' -硫代核苷酸、碳環(huán)核苷酸、 1,5-無水己糖醇核苷酸、L-核苷酸、a-核苷酸、修飾的堿基核苷酸、蘇-戊呋喃糖基核苷 酸、無環(huán)3',4' -seco核苷酸、無環(huán)3,4-二羥基丁基核苷酸、無環(huán)3, 5二羥基戊基核苷酸、 3' -3' -倒置的核苷酸結(jié)構(gòu)部分、3' -3' -倒置的脫堿基結(jié)構(gòu)部分、3' -2' -倒置的核苷酸 結(jié)構(gòu)部分、3' -2' -倒置的脫堿基結(jié)構(gòu)部分、1,4-丁二醇磷酸酯、3' -氨基磷酸酯、己基磷酸 酯、氨基己基磷酸酯、3 ' -磷酸酯、3 '硫代磷酸酯、二硫代磷酸酯或橋接的或未橋接的甲基膦 酸酯結(jié)構(gòu)部分。
[0037]細朐免疫件/細朐免疫應(yīng)答:細朐免疫件典型地渉及響應(yīng)某種抗原激活巨噬細 胞、天然殺傷細胞(NK)、抗原特異性細胞毒性T淋巴細胞和釋放多種細胞因子。在更常見的 方面,細胞免疫性不是基于抗體,而是基于免疫系統(tǒng)細胞的激活。典型地,細胞免疫應(yīng)答可 以通過下述表征:例如,激活能夠在細胞中誘導(dǎo)凋亡的抗原特異性細胞毒性T淋巴細胞,例 如,特異性免疫細胞,如樹突細胞或其他細胞,在其表面上展示外源抗原的表位。此類細胞 可以是病毒感染的或感染了細胞內(nèi)細菌,或是展示腫瘤抗原的癌細胞。其他特征可以是激 活巨噬細胞和天然殺傷細胞,允許其破壞病原體并且刺激細胞分泌多種影響參與適應(yīng)性免 疫應(yīng)答和先天性免疫應(yīng)答的其他細胞的功能的細胞因子。
[0038] 是脫氧核糖核酸的常用縮寫。其是一種核酸分子,S卩,是由核苷酸組成的 聚合物。這些核苷酸通常是脫氧-腺苷-單磷酸、脫氧_胸苷-單磷酸、脫氧-鳥苷-單磷 酸和脫氧-胞苷-單磷酸單體,其本身由糖結(jié)構(gòu)部分(脫氧核糖)、堿基結(jié)構(gòu)部分和磷酸結(jié) 構(gòu)部分組成,并且通過特有的骨架結(jié)構(gòu)聚合在一起。所述骨架結(jié)構(gòu)典型地由第一單體的核 苷酸的糖結(jié)構(gòu)部分(即,脫氧核糖)與第二相鄰單體的磷酸結(jié)構(gòu)部分之間的硫酸二酯鍵形 成。單體的特定順序,即,與糖/磷酸-骨架連接的堿基的順序,稱為DNA序列。DNA可以是 單鏈的或雙鏈的。在雙鏈形式中,第一鏈的核苷酸典型地與第二鏈的核苷酸雜交,例如,通 過A/T-堿基配對和G/C-堿基配對雜交。
[0039]表位:表位(還稱為'抗原決定簇')可以區(qū)分為T細胞表位和B細胞表位。在本 發(fā)明的情形中,蛋白的T細胞表位或部分可以包含優(yōu)選具有約6-約20個或甚至更多個氨 基酸的長度的片段,例如,由I類MHC分子加工和呈遞的片段,優(yōu)選具有約8-約10個氨基 酸的長度,例如,8,9,或10個氨基酸(或甚至11或12個氨基酸),或通過II類MHC分子加 工和呈遞的片段,優(yōu)選具有約13個以上氨基酸的長度,例如,13,14,15,16,17,18,19, 20個 或甚至更多個氨基酸,其中這些片段可以選自氨基酸序列的任意部分。這些片段典型地以 由所述肽片段和MHC分子組成的復(fù)合物的形式被T細胞識別,S卩,所述片段典型地不以其天 然形式被識別。B細胞表位典型地是位于本文定義的(天然)蛋白或肽抗原的外表面上的 片段,優(yōu)選具有5-15個氨基酸,更優(yōu)選具有5-12個氨基酸,甚至更優(yōu)選具有6-9個氨基酸, 其可以被抗體識別,即,以其天然形式被識別。
[0040] 蛋白或肽的此類表位還可以選自本文提及的所述蛋白或肽的變體中的任一種。在 這一情形中,抗原決定簇可以是構(gòu)象或不連續(xù)的表位,其由本文定義的蛋白或肽的片段構(gòu) 成,所述片段在本文定義的蛋白或肽的氨基酸序列上是不連續(xù)的,但是在三維結(jié)構(gòu)上聚在 一起,或者是由單一多肽鏈組成的連續(xù)或線性的表位。
[0041] 序列的片段:序列的片段典型地是例如核酸分子或氨基酸序列的全長序列的較短 的部分。因此,片段典型地由與全長序列內(nèi)相對應(yīng)的片段相同的序列組成。在本發(fā)明的情 形中,優(yōu)選的序列片段由連續(xù)的實體(諸如核苷酸或氨基酸)的片段組成,其對應(yīng)于所述片 段所來源的分子中的連續(xù)的實體片段,其代表所述片段所來源的完整(即,全長)分子的至 少20%、優(yōu)選至少30%、更優(yōu)選至少40%、更優(yōu)選至少50%、甚至更優(yōu)選至少60%、甚至更 優(yōu)選至少70 %并且最優(yōu)選至少80%。
[0042] G/C修飾的:G/C修飾的核酸可以典型地是本文定義的核酸,優(yōu)選人工核酸分子, 基于修飾的野生型序列,與該野生型序列相比,其包含優(yōu)選增加數(shù)量的鳥苷和/或胞苷核 苷酸。所述增加數(shù)量可以通過將含有腺苷或胸苷核苷酸的密碼子替換為含有鳥苷或胞苷核 苷酸的密碼子而產(chǎn)生。如果在DNA或RNA的編碼區(qū)中存在富集的G/C含量,則其利用遺傳 密碼的簡并性。因此,所述密碼子置換優(yōu)選不改變所編碼的氨基酸殘基,而是專一地增加核 酸分子的G/C含量。
[0043] 基因治療:基因治療可以典型地理解為意指通過編碼肽或蛋白的核酸對患者機體 或?qū)颊邫C體的分離的元件(例如,分離的組織/細胞)的治療。其典型地可以包括下述 步驟的至少一個:a)直接向患者施用核酸,優(yōu)選本文定義的人工核酸分子-通過任意施用 途徑-或者體外施用至分離的患者細胞/組織,其導(dǎo)致在體內(nèi)/離體或體外轉(zhuǎn)染患者的細 胞;b)所引入的核酸分子的轉(zhuǎn)錄和/或翻譯;以及任選地,c)如果所述核酸不是直接施用 給所述患者,將分離的、轉(zhuǎn)染的細胞重新施用至所述患者。
[0044] 基因接種:基因接種可以典型地理解為通過施用編碼抗原或其免疫原或片段的核 酸分子進行的接種。核酸分子可以施用給受試者機體或受試者的分離的細胞。當(dāng)轉(zhuǎn)染機體 的特定細胞或者當(dāng)轉(zhuǎn)染分離的細胞時,所述抗原或免疫原可以由這些細胞表達,并且隨后 呈遞至免疫系統(tǒng),引發(fā)適應(yīng)性,即,抗原特異性免疫應(yīng)答。因此,基因接種典型地包括下述 步驟中的至少一種:a)向受試者、優(yōu)選患者、或向受試者(優(yōu)選患者)的分離的細胞施用核 酸,優(yōu)選本文定義的人工核酸分子,其通常導(dǎo)致在體外或體外轉(zhuǎn)染受試者的細胞;b)所引 入的核酸分子的轉(zhuǎn)錄和/或翻譯;以及任選地,c)如果所述核酸不是直接施用給所述患者, 將分離的、轉(zhuǎn)染的細胞重新施用至所述受試者,優(yōu)選所述患者。
[0045] 異源序列:如果兩種序列不是來源于同一種基因,則典型地理解其為'異源的'。 艮P,盡管異源序列可能是來源于相同的生物體,它們天然(在自然中)不存在于同一種核酸 分子中,諸如存在于同一種mRNA中。
[0046] 體液免疫件/體液免疫應(yīng)答:體液免疫件典型地是指抗體產(chǎn)牛和仵詵地伴隨抗體 產(chǎn)生的輔助過程。例如,體液免疫應(yīng)答可以典型地特征在于,Th2激活和細胞因子產(chǎn)生,生 發(fā)中心形成和同種異型轉(zhuǎn)換,親和力成熟和記憶細胞產(chǎn)生。體液免疫性還典型地可以指抗 體的效應(yīng)子功能,其包括病原體和毒素中和作用,經(jīng)典補體激活和吞噬作用及病原體消除 的調(diào)理促進。
[0047]免疫原:在本發(fā)明的情形中,免疫原可以典型地理解為能夠激發(fā)免疫應(yīng)答的化合 物。優(yōu)選地,免疫原是肽、多肽或蛋白。在一個特別優(yōu)選的實施方案中,在本發(fā)明意義內(nèi)的 免疫原是所提供的核酸分子、優(yōu)選本文定義的人工核酸分子的翻譯產(chǎn)物。典型地,免疫原至 少激發(fā)適應(yīng)性免疫應(yīng)答。
[0048] 兔疫遍M性組僉並U在本發(fā)明的情形中,免疫刺激性組合物可以典型地理解為包 含至少一種能夠誘導(dǎo)免疫應(yīng)答的成分的組合物或能夠誘導(dǎo)免疫應(yīng)答的成分所來源的組合 物。所述免疫應(yīng)答優(yōu)選可以是先天性免疫應(yīng)答或適應(yīng)性和先天性免疫應(yīng)答的組合。優(yōu)選 地,在本發(fā)明的情形中,免疫刺激性組合物包含至少一種人工核酸分子,更優(yōu)選地包含RNA, 例如,mRNA分子。免疫刺激性成分,如mRNA,可以與適當(dāng)?shù)妮d體復(fù)合。因此,所述免疫刺激 性組合物可以包含mRNA/載體復(fù)合物。此外,免疫刺激性組合物可以包含佐劑和/或用于 所述免疫刺激性成分(如mRNA)的適當(dāng)?shù)馁x形劑。
[0049]免疫應(yīng)答:免疫應(yīng)答典型地可以是適應(yīng)件免疫系統(tǒng)針對特定抗原的特異件反應(yīng) (所謂的特異性或適應(yīng)性免疫應(yīng)答)或是先天性免疫系統(tǒng)的非特異性反應(yīng)(所謂的非特異 性或先天性免疫應(yīng)答)或是二者的組合。
[0050]免疫系統(tǒng):免疫系統(tǒng)可以保護牛物體免受感染。如果病原體成功經(jīng)過生物體的物 理屏障并且進入該生物體,則先天性免疫系統(tǒng)提供立即的但非特異性的應(yīng)答。如果病原體 逃避了該先天性應(yīng)答,則脊椎動物具有第二層保護,即,適應(yīng)性免疫系統(tǒng)。此處,免疫系統(tǒng)在 感染過程中改變其應(yīng)答以改善其對病原體的識別。然后,在病原體被清除后,這種改善的應(yīng) 答以免疫學(xué)記憶的形式被保留,并且允許適應(yīng)性免疫系統(tǒng)在每次遇到該病原體時啟動更快 速和更強的攻擊。據(jù)此,免疫系統(tǒng)包括先天性和適應(yīng)性免疫系統(tǒng)。這兩個部分中的每一個 典型地包含所謂的體液和細胞成分。
[0051]免疫刺激件RNA:在本發(fā)明的情形中,免疫刺激件RNA(isRNA)可以典型地是能夠 誘導(dǎo)先天性免疫應(yīng)答的RNA。其通常不具有可讀框,并且因此不提供肽-抗原或免疫原,而 是例如通過與特定種類的Toll-樣受體(TLR)或其他適當(dāng)?shù)氖荏w結(jié)合而激發(fā)免疫應(yīng)答。然 而,具有可讀框并且編碼肽/蛋白的mRNAs當(dāng)然也可以誘導(dǎo)先天性免疫應(yīng)答,并且因此,也 可以是免疫刺激性RNAs。
[0052]先天件免疫系統(tǒng):先天件免疫系統(tǒng)(也稱為非特異性(非特定的)免疫系統(tǒng))典 型地包括以非特異性方式保護宿主防御其他生物體的感染的細胞和機制。這意指先天性 系統(tǒng)的細胞可以以一般方式識別病原體并且針對其反應(yīng),但是與適應(yīng)性免疫系統(tǒng)不同,其 不賦予宿主長久的或保護性的免疫性。例如,先天性免疫系統(tǒng)可以被Toll-樣受體(TLRs) 的配體或其他輔助性物質(zhì)激活,所述其他輔助性物質(zhì)如脂多糖,TNF-a,CD40配體或細胞 因子,單核因子,淋巴因子,白介素或趨化因子,IL-1,IL-2,IL-3,IL-4,IL-5,IL-6,IL-7, IL-8,IL-9,IL-10,IL-11,IL-12,IL-13,IL-14,IL-15,IL-16,IL-17,IL-18,IL-19,IL-20, IL-21,IL-22,IL-23,IL-24,IL-25,IL-26,IL-27,IL-28,IL-29,IL-30,IL-31,IL-32, IL-33,IFN-a,IFN-P,IFN-Y,GM-CSF,G-CSF,M-CSF,LT-P,TNF-a,生長因子,和hGH, 人Toll-樣受體TLR1、TLR2、TLR3、TLR4、TLR5、TLR6、TLR7、TLR8、TLR9、TLRlO的配體,鼠 Toll-樣受體TLR1、TLR2、TLR3、TLR4、TLR5、TLR6、TLR7、TLR8、TLR9、TLR10、TLR11、TLR12 或TLR13的配體,NOD-樣受體的配體,RIG-I樣受體的配體,免疫刺激性核酸,免疫刺激性 RNA(isRNA),CpG-DNA,抗菌劑或抗病毒劑。本發(fā)明所述的藥物組合物可以包含一種或多種 這樣的種類。典型地,先天性免疫系統(tǒng)的反應(yīng)包括通過產(chǎn)生化學(xué)因子招募免疫細胞至感染 部位,所述化學(xué)因子包括專門的化學(xué)調(diào)節(jié)劑,稱為細胞因子;激活補體級聯(lián);通過專門的白 血細胞識別并且去除器官、組織、血液和淋巴中存在的外源物質(zhì);激活適應(yīng)性免疫系統(tǒng);和 /或作用為針對傳染劑的物理和化學(xué)屏障。
[0053]克降位點:克降位點典型地理解為核酸分子適于插入核酸序列(例如包含可讀框 的核酸序列)的片段。插入可以通過本領(lǐng)域技術(shù)人員已知的任何分子生物學(xué)方法進行,例 如,通過限制性和連接進行。克隆位點典型地包含一個或多個限制酶識別位點(限制性位 點)。所述一個或多個限制性位點可以被在這些位點切割DNA的限制酶識別。包含多于一 種限制性位點的克隆位點也可以稱為多克隆位點(MCS)或多聚接頭(polylinker)。
[0054]核酸分子:核酸分子是包含、優(yōu)選由核酸成分組成的分子。術(shù)語核酸分子優(yōu)選是指 DNA或RNA分子。其優(yōu)選地與術(shù)語"聚核苷酸"同義使用。優(yōu)選地,核酸分子是包含通過糖 /磷酸骨架的磷酸二酯鍵彼此共價連接的核苷酸單體或由通過糖/磷酸骨架的磷酸二酯鍵 彼此共價連接的核苷酸單體組成的聚合物。術(shù)語"核酸分子"還包括修飾的核酸分子,諸如 堿基修飾的、糖修飾的或骨架修飾等的DNA或RNA分子。
[0055]可讀框:在本發(fā)明的情形中,可讀框(ORF)可以典型地是幾個可以翻譯成肽或蛋 白的核苷酸三聯(lián)體的序列。可讀框優(yōu)選地包含在其5' -端的起始密碼子,S卩,通常編碼氨 基酸甲硫氨酸的三個順次的核苷酸的組合(ATG或AUG)和通常表現(xiàn)出是3個核苷酸的倍數(shù) 的長度的后續(xù)區(qū)域。ORF末端優(yōu)選為終止密碼子(例如,TAA,TAG,TGA)。典型地,這是可讀 框的唯一的終止密碼子。因此,在本發(fā)明的情形中,可讀框優(yōu)選為由可以被三整除的核苷酸 數(shù)目組成的核苷酸序列,其以起始密碼子(例如,ATG或AUG)起始,并且其優(yōu)選地以終止密 碼子(例如,分別為TAA,TGA,或TAG或UAA,UAG,UGA)結(jié)束??勺x框可以被分離,或者其可 以被結(jié)合到較長的核酸序列中,例如,結(jié)合在載體或mRNA中??勺x框也可以稱為'蛋白編碼 區(qū),。
[0056] 或多肽典型地是通過肽鍵連接的氨基酸單體的聚合物。其典型地包含少于 50個單體單位。然而,術(shù)語肽不排除具有多于50個單體單位的分子。長肽也稱為多肽,典 型地具有50-600個單體單位。
[0057]藥物有效量:在本發(fā)明的情形中,藥物有效量典型地理解為足以誘導(dǎo)藥物作用的 量,所述藥物作用如免疫應(yīng)答,改變表達的肽或蛋白的病理水平,或替代缺乏的基因產(chǎn)物, 例如,在致病性情形中。
[0058]蛋白:蛋白典型地包含一種或多種肽或多肽。蛋白典型地折疊成3維形式,其可以 是蛋白發(fā)揮其生物學(xué)功能所需要的。
[0059]聚腺苷酸序列:聚腺苷酸序列,也稱為聚腺苷酸尾或3'-聚腺苷酸尾,典型地理 解為腺苷核苷酸的序列,例如多至約400個腺苷核苷酸的序列,例如,約20至約400個、優(yōu) 選約50至約400個、更優(yōu)選約50至約300個、甚至更優(yōu)選約50至約250個、最優(yōu)選約60 至約250個腺苷核苷酸的序列。聚腺苷酸序列典型地位于mRNA的3'端。在本發(fā)明的情形 中,聚腺苷酸序列可以位于mRNA或任意其他核酸分子內(nèi),諸如例如,在載體中,例如,在作 為產(chǎn)生RNA(優(yōu)選mRNA)的模板的載體中,例如,通過所述載體的轉(zhuǎn)錄產(chǎn)生。
[0060] 聚腺苷酸化:聚腺苷酸化A型地理解為向核酸分子,如RNA分子,例如,向未成熟 的mRNA添加聚腺苷酸序列。聚腺苷酸化可以由所謂的聚腺苷酸化信號誘導(dǎo)。該信號優(yōu)選 地位于在要被聚腺苷酸化的核酸分子(諸如RNA分子)的3'-端的核苷酸片段內(nèi)。聚腺苷 酸化信號典型地包含由腺嘌呤和尿嘧啶/胸腺嘧啶核苷酸組成的六聚體,優(yōu)選為六聚體序 列AAUAAA。其他序列,優(yōu)選六聚體序列也是可考慮的。聚腺苷酸化典型地在前mRNA(也稱 為不成熟的mRNA)加工過程中發(fā)生。典型地,RNA成熟(由前mRNA到成熟的mRNA)包括聚 腺苷酸化的步驟。
[0061] 限制性位點:限制性位點,也稱為'限制酶識別位點',是由限制酶識別的核苷酸序 列。限制性位點典型地是短的、優(yōu)選回文核苷酸序列,例如,包含4-8個核苷酸的序列。限 制性位點優(yōu)選被限制酶特異性識別。限制酶典型地在該位點切割包含限制性位點的核苷酸 序列。在雙鏈核苷酸序列中,諸如雙鏈DNA序列中,限制酶典型地切斷該核苷酸序列的兩條 鏈。
[0062]RNA,mRNA :RNA是核糖核酸的常用縮寫。其是核酸分子,即,由核苷酸組成的聚合 物。這些核苷酸通常為腺苷-單磷酸,尿苷-單磷酸,鳥苷-單磷酸和胞苷-單磷酸單體, 其沿著所謂的骨架彼此連接。所述骨架由第一單體的糖(即核糖)與第二相鄰單體的磷酸 結(jié)構(gòu)部分之間的磷酸二酯鍵形成。所述單體的特定的連續(xù)稱為RNA序列。通常,RNA可以 通過DNA序列轉(zhuǎn)錄獲得,例如,在細胞內(nèi)轉(zhuǎn)錄。在真核細胞中,轉(zhuǎn)錄典型地在細胞核或線粒 體中進行。在體內(nèi),DNA的轉(zhuǎn)錄通常產(chǎn)生所謂的未成熟的RNA,其必須經(jīng)過加工成為所謂的 信使RNA(通??s寫為mRNA)。未成熟的RNA的加工,例如,在真核生物體中,包括多種不同 的轉(zhuǎn)錄后修飾,如剪接,5'-加帽,聚腺苷酸化,從細胞核或線粒體中輸出等。這些加工的綜 合也稱為RNA的成熟。成熟的信使RNA通常提供可以翻譯成特定的肽或蛋白的氨基酸序列 的核苷酸序列。典型地,成熟的mRNA包含5' -帽、5' UTR、可讀框、3' UTR和聚腺苷酸序列。 除了信使RNA之外,也存在一些非編碼類型的RNA,其可能參與轉(zhuǎn)錄和/或翻譯的調(diào)節(jié)。
[0063]核酸分子的序列:核酸分子的序列典型地理解為其核苷酸的特定的目.為個體的順 序(即,連續(xù)性)。蛋白或肽的序列典型地理解為其氨基酸的順序(即,連續(xù)性)。
[0064] 序列同一性:如果兩種以上的序列表現(xiàn)出相同的長度和核苷酸或氨基酸順序,則 其是相同的。同一性百分?jǐn)?shù)典型地描述兩種序列相同的程度,即,其典型地描述在其序列位 置對應(yīng)于參比序列的相同的核苷酸的核苷酸的百分?jǐn)?shù)。為了確定同一性程度,認(rèn)為待比較 的序列表現(xiàn)出相同的長度,即,表現(xiàn)出待比較的序列中最長的序列的長度。這意味著由8個 核苷酸組成的第一序列與由10個核苷酸組成(包含第一序列)的第二序列80%相同。換 言之,在本發(fā)明的情形中,序列的同一性優(yōu)選地涉及在具有相同長度的兩種以上序列中具 有相同位置的序列的核苷酸的百分?jǐn)?shù)。缺口通常視為不相同的位置,而不管其在比對中的 實際位置。
[0065] 穩(wěn)定的核酸分子:穩(wěn)定的核酸分子是被修飾使得其比不具有所述修飾的核苷酸分 子更穩(wěn)定的針對崩解或降解(例如,通過環(huán)境因素或酶消化,諸如通過外切或內(nèi)切核酸酶 降解)的DNA或RNA分子。優(yōu)選地,在本發(fā)明的情形中,穩(wěn)定的核酸分子在細胞中被穩(wěn)定, 諸如,在原核或真核細胞中,優(yōu)選在哺乳動物細胞中,如人細胞中被穩(wěn)定。穩(wěn)定作用還可以 在細胞外發(fā)揮,例如,在緩沖液等中,例如,在制備包含所述穩(wěn)定的核酸分子的藥物組合物 的過程中。
[0066]轉(zhuǎn)染:術(shù)語'轉(zhuǎn)染'是指向細胞中,優(yōu)選向真核細胞中引入核酸分子,如DNA或RNA(例如,mRNA)分子。在本發(fā)明的情形中,術(shù)語'轉(zhuǎn)染'包括技術(shù)人員已知的向細胞中、優(yōu) 選向真核細胞中、如想哺乳動物細胞中引入核酸分子的任意方法。所述方法包括,例如,電 穿孔,脂轉(zhuǎn)染,例如,基于陽離子脂質(zhì)和/或脂質(zhì)體,磷酸鈣沉淀,基于納米顆粒的轉(zhuǎn)染,基 于病毒的轉(zhuǎn)染,或基于陽離子聚合物(如DEAE-葡聚糖或聚乙醇胺等)的轉(zhuǎn)染。優(yōu)選地,弓丨 入是非病毒性的。
[0067]疫苗:疫苗典型地理解為提供至少一種抗原、優(yōu)選免疫原的預(yù)防性或治療性物質(zhì)。 所述抗原或免疫原可以來源于適于接種的任意物質(zhì)。例如,所述抗原或免疫原可以來源于 病原體,諸如來源于細菌或病毒顆粒等,或來源于腫瘤或癌組織。所述抗原或免疫原刺激機 體的適應(yīng)性免疫系統(tǒng)提供適應(yīng)性免疫應(yīng)答。
[0068]載體:術(shù)語'載體'是指核酸分子,優(yōu)選是指人工核酸分子。在本發(fā)明的情形中,載 體適于結(jié)合或攜帶需要的核酸序列,如包含可讀框的核酸序列。此類載體可以是存儲載體、 表達載體、克隆載體、轉(zhuǎn)移載體等。存儲載體是允許便利地保存核酸分子(例如,mRNA分子) 的載體。因此,該載體可以包含例如與需要的mRNA序列或其部分對應(yīng)的序列,諸如與mRNA 的可讀框和3'UTR對應(yīng)的序列。表達載體可以用于產(chǎn)生表達產(chǎn)物,如RNA,例如,mRNA,或 肽,多肽或蛋白。例如,表達載體可以包含載體的序列片段轉(zhuǎn)錄所需要的序列,諸如啟動子 序列,例如,RNA啟動子序列??寺≥d體典型地是包含克隆位點的載體,所述克隆位點可以 用于將核酸序列結(jié)合到所述載體中。克隆載體可以是,例如,質(zhì)粒載體或噬菌體載體。轉(zhuǎn)移 載體可以是適于將核酸分子轉(zhuǎn)移至細胞或生物體中的載體,例如,病毒載體。在本發(fā)明的情 形中,載體可以是,例如,RNA載體或DNA載體。優(yōu)選地,載體是DNA分子。優(yōu)選地,在本發(fā) 明的意義中的載體包含克隆位點,選擇標(biāo)記,如抗生素抗性因子,和適于載體增殖的序列, 諸如復(fù)制起點。優(yōu)選地,在本申請的情形中的載體是質(zhì)粒載體。
[0069] 賦形劑(Vehicle):賦形劑典型地理解為話于存儲、轉(zhuǎn)運和/或施用化合物(如藥 物活性化合物)的物質(zhì)。例如,其可以生理學(xué)可接受的適于存儲、轉(zhuǎn)運和/或施用藥物活性 化合物的液體。
[0070] 3'-非翻譯區(qū)(3'UTR) :3'UTR典型地是mRNA位于mRNA的蛋白編碼區(qū)(S卩,可讀 框)與聚腺苷酸序列之間的部分。mRNA的3'UTR不翻譯成氨基酸序列。3'UTR序列通常 由在基因表達過程中轉(zhuǎn)錄成各自的mRNA的基因所編碼?;蚪M序列首先轉(zhuǎn)錄為未成熟的 mRNA,其包含可選的內(nèi)含子。然后,所述未成熟的mRNA在成熟過程中進一步加工成成熟的 mRNA。該成熟過程包括下述步驟:5'加帽、剪接未成熟的mRNA以切除可選的內(nèi)含子,和修 飾3' -端,如未成熟的mRNA的3' -端聚腺苷酸化,和任選地內(nèi)切或外切核酸酶切割等。在 本發(fā)明的情形中,3'UTR對應(yīng)于成熟mRNA中位于蛋白編碼區(qū)的終止密碼子的3'的序列,優(yōu) 選緊接著蛋白編碼區(qū)的終止密碼子的3',并且其延伸至聚腺苷酸序列的5' -端側(cè),優(yōu)選至 緊接著聚腺苷酸序列的5'的核苷酸。術(shù)語"對應(yīng)于"意指3'UTR序列可以是RNA序列,諸 如在用于定義3 'UTR序列的mRNA序列中,或是與所述RNA序列對應(yīng)的DNA序列。在本發(fā)明 的情形中,術(shù)語"基因的3'UTR",如"白蛋白基因的3'UTR",是對應(yīng)于來源于該基因的成熟 mRNA(即,通過該基因的轉(zhuǎn)錄和未成熟的mRNA的成熟獲得的mRNA)的3'UTR的序列。術(shù)語 "基因的3'UTR"包括3'UTR的DNA序列和RNA序列。
[0071]5' -非翻譯區(qū)(5'UTR) :5'UTRA型地理解為信#RNA(mRNA)的特定部分。其位 于mRNA的可讀框的5'。典型地,5'UTR起始于轉(zhuǎn)錄起始位點并且終止于可讀框的起始密 碼子之前的一個核苷酸。所述5'UTR可以包含用于控制基因表達的元件,其也稱為調(diào)控 元件。所述調(diào)控元件可以是,例如,核糖體結(jié)合位點或5' -端寡嘧啶片段(5'-Terminal OligopyrimidineTract)。5'UTR可以進行轉(zhuǎn)錄后修飾,例如,通過添加5'-帽。在本發(fā)明 的情形中,5'UTR對應(yīng)于成熟mRNA位于5'帽與起始密碼子之間的序列。優(yōu)選地,5'UTR對 應(yīng)于從位于5'-帽的3'的核苷酸(優(yōu)選從位于緊接著5'帽的3'的核苷酸)延伸至位于蛋 白編碼區(qū)的起始密碼子的5'的核苷酸(優(yōu)選至位于緊接著蛋白編碼區(qū)的起始密碼子的5' 的核苷酸)的序列。位于緊接著成熟mRNA的5'帽的3'的核苷酸典型地對應(yīng)于轉(zhuǎn)錄起始位 點。術(shù)語"對應(yīng)于"意指5'UTR序列可以是RNA序列,諸如在用于限定5'UTR序列的mRNA 序列中,或與所述RNA序列相對應(yīng)的DNA序列。在本發(fā)明的情形中,術(shù)語"基因的5'UTR", 如"TOP基因的5'UTR",是對應(yīng)于來源于該基因的成熟mRNA(S卩,通過該基因的轉(zhuǎn)錄和未成 熟的mRNA的成熟獲得的mRNA)的5'UTR的序列。術(shù)語"基因的5'UTR"包括5'UTR的DNA 序列和RNA序列。
[0072] 5'端宴嘧啶片段(TOP) :5'端寡嘧啶片段(TOP)典型地是位于核酸分子的5'端 區(qū)域的嘧啶核苷酸的片段,諸如位于特定基因的特定的mRNA分子的5'端區(qū)域或功能實體 的5'端區(qū)域,例如,轉(zhuǎn)錄區(qū)。所述序列起始于胞苷,其通常對應(yīng)于轉(zhuǎn)錄起始位點,并且之后 接著通常約3-30個嘧啶核苷酸的片段。例如,TOP可以包含3,4, 5,6, 7,8,9,10,11,12,13, 14,15,16,17,18,19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30 或甚至更多個核苷酸。所述嘧啶 片段并且由此5'TOP終止于位于TOP下游的第一個嘌呤核苷酸的5'的一個核苷酸。包含 5'端寡嘧啶片段的信使RNA通常稱為5'TOPmRNA。因此,提供所述信使RNAs的基因稱 為TOP基因。例如,已在基因和編碼肽延伸因子和核糖體蛋白的mRNAs中發(fā)現(xiàn)TOP序列。
[0073]TOP基序:在本發(fā)明的情形中,TOP基序是對應(yīng)于上文定義的5'TOP的核酸序列。 因此,在本發(fā)明的情形中,TOP基序優(yōu)選是具有3-30個核苷酸的長度的嘧啶核苷酸的片段。 優(yōu)選地,TOP-基序由至少3個嘧啶核苷酸組成,優(yōu)選至少4個嘧啶核苷酸,優(yōu)選至少5個嘧 啶核苷酸組成,更優(yōu)選至少6個核苷酸,更優(yōu)選至少7個核苷酸、最優(yōu)選至少8個嘧啶核苷 酸組成,其中嘧啶核苷酸的片段優(yōu)選地在其5'端起始于胞嘧啶核苷酸。在TOP基因和TOP mRNAs中,TOP-基序優(yōu)選地在其5'端起始于轉(zhuǎn)錄起始位點,并且終止于所述基因或mRNA中 第一個嘌呤殘基的5'的一個核苷酸。在本發(fā)明的意義中的TOP基序優(yōu)選地位于代表5'UTR 的序列的5'端或位于編碼5'UTR的序列的5'端。因此,優(yōu)選地,如果該片段位于各種序列 (如本發(fā)明所述的人工核酸分子,本發(fā)明所述的人工核酸分子的5'UTR元件,或來源于本文 所述的TOP基因的5'UTR的核酸序列)的5'端,則3個以上嘧啶核苷酸的片段稱為本發(fā) 明的意義中的"TOP基序"。換言之,不位于5'UTR或5'UTR元件的5' -端而是位于5'UTR 或5'UTR元件內(nèi)的任意位置的3個以上嘧啶核苷酸的片段優(yōu)選不稱為"TOP基序"。
[0074]TOP某閔:TOP基因典型地特征在于存在5'端寡嘧啶片段。此外,大部分TOP基因 特征在于生長相關(guān)的翻譯調(diào)節(jié)。然而,還已知具有組織特異性翻譯調(diào)節(jié)的TOP基因。如上 f定義,TOP某閔的5'UTR對應(yīng)于來源于TOP基因的成熟mRNA的5'UTR的序列,其優(yōu)選地 從位于5'帽的3'的核苷酸延伸至位于起始密碼子的5'的核苷酸。TOP基因的5'UTR典 型地不包含任意起始密碼子,優(yōu)選地沒有上游AUGs(uAUGs)或上游可讀框(uORFs)。此處, 上游AUGs和上游可讀框典型地理解為存在于應(yīng)該被翻譯的可讀框的起始密碼子(AUG)的 5'的AUGs和可讀框。TOP基因的5'UTRs通常相當(dāng)短。TOP基因的5'UTRs的長度可以在 20個核苷酸至500個核苷酸之間變化,并且典型地少于約200個核苷酸,優(yōu)選少于約150個 核苷酸,更優(yōu)選少于約100個核苷酸。在本發(fā)明的意義中的示例性的TOP基因的5'UTRs是 在SEQIDNOs. 1-1363,1435,1461和1462的序列中從位置5的核苷酸延伸至位于緊接著 起始密碼子(例如,ATG)的5'的核苷酸的核酸序列。
[0075] 在第一方面中,本發(fā)明涉及一種人工核酸分子,其包含:
[0076]a.至少一個5' -非翻譯區(qū)元件(5'UTR元件),其包含來源于TOP基因的5'UTR 或來源于TOP基因的5'UTR的變體的核酸序列或由來源于TOP基因的5'UTR或來源于TOP 基因的5'UTR的變體的核酸序列組成;和
[0077]b?至少一個可讀框(ORF)。
[0078] 優(yōu)選地,所述人工核酸分子還包含:
[0079] c?至少一個組蛋白莖環(huán)。
[0080] 所述人工核酸分子可以是DNA或RNA。在所述人工核酸分子是DNA的情形中,其可 以用于提供RNA,優(yōu)選具有對應(yīng)的序列的mRNA,如下文進一步所述。由于其可以提供增加的 和/或延長的由可讀框編碼的蛋白的蛋白產(chǎn)生,本發(fā)明的人工核酸分子特別用于基因治療 和基因接種。
[0081] 在這一情形中,術(shù)語'5'UTR元件'優(yōu)選是指表示人工核酸序列(如人工mRNA)的 5'UTR的核酸序列,或指編碼人工核酸分子的5'UTR的核酸序列。因此,優(yōu)選地,5'UTR元 件可以是mRNA的5'UTR,優(yōu)選人工mRNA的5'UTR,或其可以是用于mRNA的5'UTR的轉(zhuǎn)錄 模板。因此,5'UTR元件優(yōu)選地是對應(yīng)于mRNA的5'UTR(優(yōu)選人工mRNA(如通過遺傳改造 的載體構(gòu)建體的轉(zhuǎn)錄獲得的mRNA)的5'UTR)的核酸序列。優(yōu)選地,在本發(fā)明的意義中的 5'UTR發(fā)揮5'UTR的作用或者編碼實現(xiàn)5'UTR的功能的核苷酸序列。術(shù)語'5'UTR元件' 還指人工核酸序列(如人工mRNA)的5'UTR的片段或部分,或其編碼人工核酸分子的5'UTR 的部分或片段。這意指本發(fā)明的意義中的5'UTR元件可以包含在人工核酸序列(諸如人工 mRNA)的5'UTR中,或其編碼人工核酸分子的5'UTR。
[0082] 按照本發(fā)明,5'UTR元件包含或由來源于TOP基因的5'UTR或來源于TOP基因的 5'UTR的變體的核苷酸序列組成。
[0083] 術(shù)語'來源于TOP基因的5'UTR的核苷酸序列'優(yōu)選是指基于TOP基因的5'UTR 序列或其片段的核苷酸序列。該術(shù)語包括對應(yīng)于完整5'UTR序列(S卩,TOP基因的全長 5'UTR序列)的序列,和對應(yīng)于TOP基因的5'UTR序列的片段的序列。優(yōu)選地,TOP基因的 5'UTR的片段由對應(yīng)于TOP基因中全長5'UTR中的連續(xù)的核苷酸片段的連續(xù)的核苷酸片段 組成,其表示TOP基因全長5 'UTR的至少20 %,優(yōu)選至少30 %,更優(yōu)選至少40 %,更優(yōu)選至 少50 %,甚至更優(yōu)選至少60 %,甚至更優(yōu)選至少70 %,甚至更優(yōu)選至少80 %,并且最優(yōu)選至 少90%。在本發(fā)明的意義中,所述片段優(yōu)選是本文所述的功能片段。特別優(yōu)選的TOP基因 的5'UTR的片段是TOP基因缺少5'TOP基序的5'UTR。術(shù)語'TOP基因的5'UTR'優(yōu)選是 指天然存在的TOP基因的5'UTR。
[0084] 術(shù)語'TOP基因的5'UTR的變體'和在TOP基因的5'UTR的情形中的'其變體'是 指天然存在的TOP基因的5'UTR的變體,優(yōu)選是指脊椎動物TOP基因的5'UTR的變體,優(yōu) 選是指哺乳動物TOP基因的3'UTR的變體,更優(yōu)選是指人TOP基因的3'UTR的變體。所述 變體可以是TOP基因的修飾的5 'UTR。例如,與所述變體所來源的天然存在的5 'UTR相比, 變體5'UTR可以表現(xiàn)出一個或多個核苷酸缺失、插入、添加和/或置換。優(yōu)選地,TOP基因 的5 'UTR的變體與所述變體所來源的天然存在的5 'UTR至少至少40 %,優(yōu)選至少50 %,更 優(yōu)選至少60 %,更優(yōu)選至少70 %,甚至更優(yōu)選至少80 %,甚至更優(yōu)選至少90 %,最優(yōu)選至少 95%相同。優(yōu)選地,所述變體是本文所述的功能變體。
[0085] 術(shù)語"來源于TOP基因的5'UTR的變體的核酸序列"優(yōu)選是指基于TOP基因的 5'UTR序列的變體或其片段的核酸序列。該術(shù)語包括對應(yīng)于完整的變體5'UTR序列(即, TOP基因的全長變體5'UTR序列)的序列,和對應(yīng)于TOP基因的變體5'UTR序列的片段的 序列。優(yōu)選地,TOP基因的5'UTR的變體的片段由對應(yīng)于TOP基因中全長變體5'UTR中的 連續(xù)的核苷酸片段的連續(xù)的核苷酸片段組成,其表示TOP基因全長變體5'UTR的至少20%, 優(yōu)選至少30 %,更優(yōu)選至少40 %,更優(yōu)選至少50 %,甚至更優(yōu)選至少60 %,甚至更優(yōu)選至少 70 %,甚至更優(yōu)選至少80 %,并且最優(yōu)選至少90 %。在本發(fā)明的意義中,所述變體的片段優(yōu) 選是本文所述的功能片段。
[0086] 因此,人工核酸分子的5'UTR元件可以包含或由TOP基因的5'UTR的片段或TOP 基因的5'UTR的變體的片段組成,或者可以包含或由TOP基因的完整5'UTR組成,或者可 以包含或由TOP基因的5'UTR的變體組成。
[0087] 5'UTR元件優(yōu)選適于增加來自所述人工核酸分子的蛋白生產(chǎn)。
[0088] 優(yōu)選地,所述至少一個5'UTR元件與ORF功能性連接。這優(yōu)選地意指5'UTR與ORF 締合,使得其可以發(fā)揮功能,諸如對于由ORF編碼的蛋白增加蛋白生產(chǎn)的功能,或?qū)τ谌斯?核酸分子的穩(wěn)定功能。優(yōu)選地,5'UTR元件和ORF以5' 一 3'方向締合。因此,優(yōu)選地,所 述人工核酸分子包含這樣的結(jié)構(gòu):5'_5'UTR元件-(任選地)接頭-0RF-3',其中所述接頭 可以存在或不存在。例如,所述接頭可以似乎一個或多個核苷酸,如1-50或1-20個核苷酸 的片段,例如,包含或由一個或多個限制酶識別位點(限制性位點)組成。
[0089] 優(yōu)選地,所述5'UTR元件和所述至少一個可讀框是異源的。在這種情形中,術(shù)語 '異源'意指所述可讀框與所述5'UTR元件不是天然(在自然中)以這種組合存在。優(yōu)選 地,5'UTR元件來源于與可讀框不同的基因。例如,ORF可以來源于與5'UTR元件不同的基 因,例如,編碼不同的蛋白或相同的蛋白但是不同物種等的基因。例如,所述ORF不編碼由 所述5'UTR元件所來源的基因所編碼的蛋白。
[0090] 在優(yōu)選的實施方案中,5'UTR元件,優(yōu)選人工核酸分子,不包含完整的TOP-基序或 5'TOP序列。因此,優(yōu)選地,5'UTR元件,優(yōu)選人工核酸分子,不包含5'UTR元件的核酸序列 所來源的TOP基因的完整的TOP-基序。例如,本發(fā)明所述的5'UTR元件或人工核酸分子可 以包含TOP-基序或5'T0P的1,2, 3,4, 5,6, 7,8,9,10或更多個嘧啶殘基,優(yōu)選位于TOP-基 序或5'TOP的3'端側(cè)的TOP-基序的1,2,3,4,5,6,7,8,9,10或更多個嘧啶殘基。例如, 5'UTR元件可以包含或由其5'端起始于嘧啶殘基的核酸序列組成,其對應(yīng)于所述5'UTR元 件的核酸序列所來源的TOP基因的TOP-基序或5 'TOP的殘基2,3,4,5,6,7,8,9,10等。
[0091] 特別優(yōu)選地是,本發(fā)明所述的5'UTR元件,優(yōu)選人工核酸分子,不包含TOP-基序 或5'TOP。例如,來源于TOP基因的5'UTR的5'UTR元件的核酸序列在其5' -端起始于位 于TOP的5'UTR的5'端寡嘧啶片段(TOP)的下游的位置1,2, 3,4, 5,6, 7,8,9或10的核苷 酸。5'端寡嘧啶片段(TOP)的下游位置1是TOP-基序或5'TOP的3'的第一個基于嘌呤 的核苷酸。因此,在5'端寡嘧啶片段的下游的位置1是第一個核苷酸,其在5' -3' -方向 上接著5'端寡嘧啶片段的3' -端。同樣地,5'TOP下游的位置2是第二個核苷酸,其接著 5'端寡嘧啶片段的末端,位置3是第三個核苷酸,如此等等。
[0092] 因此,5'UTR元件優(yōu)選地起始于TOP基因的5'UTR的轉(zhuǎn)錄起始位點下游的5,10, 15, 20, 25, 30,40 或 50 個核苷酸。
[0093] 在一些實施方案中,來源于TOP基因的5'UTR的5'UTR元件的核酸序列在其3' -端 終止于位于其所來源的基因或mRNA的起始密碼子(例如,A(U/T)G)上游的位置1,2,3,4, 5,6,7,8,9或10的核苷酸。因此,所述5'UTR元件不包含蛋白編碼區(qū)的任意部分。因此, 優(yōu)選地,本發(fā)明的人工核酸分子的唯一的蛋白編碼部分是由所述可讀框提供的。然而,所述 可讀框優(yōu)選來源于-如上文所述-與5'UTR元件所來源的基因不同的基因。
[0094] 特別優(yōu)選的是,所述5'UTR元件不包含起始密碼子,如核苷酸序列A(U/T)G。因此, 優(yōu)選地,所述人工核酸分子不包含任意上游AUGs(或在DNA分子的情形中,上游ATGs)。換 言之,在一些實施方案中,可以優(yōu)選的是可讀框的AUG或ATG分別是人工核酸分子唯一的起 始密碼子。
[0095] 另外,優(yōu)選的是,5'UTR元件不包含可讀框。因此,優(yōu)選地,所述人工核酸分子將不 包含任意上游的可讀框。
[0096] 來源于TOP基因的5'UTR的核酸序列是來源于真核TOP基因,優(yōu)選植物或動物TOP 基因,更優(yōu)選脊索動物TOP基因,甚至更優(yōu)選脊椎動物TOP基因,最優(yōu)選哺乳動物TOP基因, 如人或小鼠TOP基因。
[0097] 優(yōu)選地,本發(fā)明所述的人工核酸分子包含這樣的5'UTR元件,其包含或由來源于 TOP基因的5'UTR的核酸序列組成,或包含或由來源于TOP基因的5'UTR的變體的核酸序 列組成,其中所述TOP基因是植物或動物TOP基因,更優(yōu)選脊索動物TOP基因,甚至更優(yōu)選 脊椎動物TOP基因,最優(yōu)選哺乳動物TOP基因,如人或小鼠TOP基因,并且其任選地不包含 核苷酸序列A(U/T)G和任選地不包含可讀框;至少一個可讀框(ORF);和任選地至少一個組 蛋白莖環(huán);其中任選地,所述5'UTR元件不包含TOP基序,并且其中任選地,所述5'UTR元 件在其5' -端起始于位于TOP基因的5'UTR的5'端寡嘧啶片段(TOP)下游的位置1,2, 3, 4, 5,6, 7,8,9或10的核苷酸,并且其中還任選地,來源于TOP的5'UTR的5'UTR元件在其 3' -端終止于位于其所來源的基因或mRNA的起始密碼子(A(U/T)G)上游的位置1,2,3,4, 5,6, 7,8,9或10的核苷酸。
[0098] 例如,所述5'UTR元件包含下述核酸序列或由下述核酸序列組成:所述核酸序列 是來源于選自由SEQIDNOs. 1-1363,SEQIDNO. 1435,SEQIDNO. 1461 或SEQIDNO. 1462 組成的組,選自SEQIDNOs. 1-1363,SEQIDNO. 1435,SEQIDNO. 1461 或SEQIDNO. 1462 的同源物或其變體,或相對應(yīng)的RNA序列的核酸序列。術(shù)語'SEQIDNOs. 1-1363,SEQID NO. 1435,SEQIDNO. 1461 或SEQIDNO. 1462 的同源物'是指除智人(Homosapiens)(人) 或小家鼠(Musmusculus)(小鼠)外的其他物種的序列,其與SEQIDNOs. 1-1363,SEQID NO. 1435,SEQIDNO. 1461 或SEQIDNO. 1462 的序列同源。例如,SEQIDNO. 1 涉及包含智 人a2巨球蛋白(A2M)的5'UTR的序列。在本發(fā)明的情形中,SEQIDNO. 1的同源物是來 源于除智人(人)之外的另一種物種的a2巨球蛋白(A2M)基因或mRNA的任意所述的序 列,諸如除人a2巨球蛋白(A2M)基因之外的任意脊椎動物,優(yōu)選任意哺乳動物a2巨球蛋 白(A2M)基因,如小鼠、大鼠、兔、猴子等的a2巨球蛋白(A2M)基因。
[0099] 在優(yōu)選的實施方案中,5' UTR元件包含下述或由下述組成:來源于由選自SEQ ID NOs. 1-1363, SEQ ID NO. 1435, SEQ ID NO. 1461或SEQ ID NO. 1462,選自SEQ ID NOs. 1-1363, SEQ ID NO. 1435, SEQ ID NO. 1461或SEQ ID NO. 1462的同源物,選自其變體, 或相應(yīng)的RNA序列的核酸序列的位置5的核苷酸(S卩,位于所述序列中的位置5的核苷 酸)延伸至緊接著起始密碼子的5'的核苷酸位置(位于所述序列的3'端)(例如,緊接著 ATG序列的5'的核苷酸位置)的核酸序列。特別優(yōu)選的是所述5'UTR元件來源于由選自 SEQ ID NOs. 1-1363, SEQ ID NO. 1435, SEQ ID NO. 1461或SEQ ID NO. 1462,選自SEQ ID NOs. 1-1363, SEQ ID NO. 1435, SEQ ID NO. 1461或SEQ ID NO. 1462的同源物,選自其變體, 或相應(yīng)的RNA序列的核酸序列的緊接著5'-T0P的3'的核苷酸位置延伸至緊接著起始密碼 子的5'的核苷酸位置(位于所述序列的3'端)(例如,緊接著ATG序列的5'的核苷酸位 置)的核酸序列。
[0100] 在優(yōu)選的實施方案中,5'UTR元件包含或由這樣的核酸序列組成:所述核酸序列 與從選自SEQIDNOs. 1-1363,SEQIDNO. 1435,SEQIDNO. 1461 或SEQIDNO. 1462,或 相應(yīng)的RNA序列的核酸序列的核苷酸位置5延伸至緊接著起始密碼子的5'的核苷酸位置 (位于所述序列的3'端)(例如,緊接著ATG序列的5'的核苷酸位置)的核酸序列具有至 少約40%,優(yōu)選至少約50%,優(yōu)選至少約60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更 優(yōu)選至少約90%,甚至更優(yōu)選至少約95 %,甚至更優(yōu)選至少約99 %的同一性,或者其中至 少一個5'UTR元件包含或由這樣的核酸序列的片段組成:所述核酸序列與從選自SEQID NOs. 1-1363,SEQIDNO. 1435,SEQIDNO. 1461 或SEQIDNO. 1462,或相應(yīng)的RNA序列的 核酸序列的核苷酸位置5延伸至緊接著起始密碼子的5'的核苷酸位置(位于所述序列的 3'端)(例如,緊接著ATG序列的5'的核苷酸位置)的核酸序列具有至少約40%,優(yōu)選至 少約50%,優(yōu)選至少約60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu)選至少約90%,甚 至更優(yōu)選至少約95%,甚至更優(yōu)選至少約99%的同一性,其中,優(yōu)選地,所述片段如上文所 述,即,是表示所述片段所來源的全長5'UTR的至少20%等的連續(xù)的核苷酸片段。
[0101] 優(yōu)選地,所述5'UTR元件包含或由這樣的核酸序列組成:所述核酸序列與從選自 SEQIDNOs. 1-1363,SEQIDNO. 1435,SEQIDNO. 1461 或SEQIDNO. 1462,或相應(yīng)的RNA 序列的核酸序列的緊接著5'TOP的3'的核苷酸位置延伸至緊接著起始密碼子的5'的核 苷酸位置(位于所述序列的3'端)(例如,緊接著ATG序列的5'的核苷酸位置)的核酸序 列具有至少約40%,優(yōu)選至少約50%,優(yōu)選至少約60%,優(yōu)選至少約70%,更優(yōu)選至少約 80%,更優(yōu)選至少約90%,甚至更優(yōu)選至少約95%,甚至更優(yōu)選至少約99%的同一'丨生,或者 其中,所述至少一種5'UTR元件包含或由這樣的核酸序列的片段組成:所述核酸序列與從 選自SEQIDNOs. 1-1363,SEQIDNO. 1435,SEQIDNO. 1461 或SEQIDNO. 1462,或相應(yīng)的 RNA序列的核酸序列的緊接著5'TOP的3'的核苷酸位置延伸至緊接著起始密碼子的5'的 核苷酸位置(位于所述序列的3'端)(例如,緊接著ATG序列的5'的核苷酸位置)的核 酸序列具有至少約40%,優(yōu)選至少約50%,優(yōu)選至少約60%,優(yōu)選至少約70%,更優(yōu)選至少 約80 %,更優(yōu)選至少約90 %,甚至更優(yōu)選至少約95 %,甚至更優(yōu)選至少約99 %的同一'丨生,其 中,優(yōu)選地,所述片段如上文所述,即,是表示所述片段所來源的全長5'UTR的至少20%等 的連續(xù)的核苷酸片段。
[0102] 優(yōu)選地,上文定義的SEQIDNOs. 1-1363,SEQIDNO. 1435,SEQIDNO. 1461 或SEQ IDNO. 1462的序列的片段和變體(例如,表現(xiàn)出至少40%的同一性)是功能性片段和變體, 如本文所描述的。
[0103] 此外,本發(fā)明所述的人工核酸分子可以包含多于一個上文所述的5'UTR元件。例 如,本發(fā)明所述的人工核酸分子可以包含一個、兩個、三個、四個或更多個5'UTR元件,其中 個體5'UTR元件可以似乎相同的或者它們可以是不同的。例如,本發(fā)明所述的人工核酸分 子可以包含兩個基本上相同的上述5'UTR元件,例如,兩個包含或由這樣的核酸序列組成 的5'UTR元件:所述核酸序列來源于選自由SEQIDNOs. 1-1363,SEQIDNO. 1435,SEQID NO. 1461 或SEQIDNO. 1462 組成的組,選自SEQIDNOs. 1-1363,SEQIDNO. 1435,SEQID NO. 1461或SEQIDNO. 1462的同源物,選自其變體,或相應(yīng)的RNA序列或選自其功能變體、 其功能片段,或上文所述的其功能變體片段的核酸序列。
[0104] 在特別優(yōu)選的實施方案中,5'UTR元件包含或由這樣的核酸序列組成:所述核酸 序列來源于編碼核糖體蛋白的TOP基因的5'UTR,或來源于編碼核糖體蛋白的TOP基因的 5'UTR的變體。特別優(yōu)選的5'UTR元件包含或由這樣的核酸序列組成:所述核酸序列來源 于編碼選白下述的核糖體蛋白的TOP基因的5'UTR:RPSA,RPS2,RPS3,RPS3A,RPS4,RPS5, RPS6,RPS7,RPS8,RPS9,RPS10,RPS11,RPS12,RPS13,RPS14,RPS15,RPS15A,RPS16,RPS17, RPS18,RPS19,RPS20,RPS21,RPS23,RPS24,RPS25,RPS26,RPS27,RPS27A,RPS28,RPS29, RPS30,RPL3,RPL4,RPL5,RPL6,RPL7,RPL7A,RPL8,RPL9,RPL10,RPLl0A,RPLlI,RPLl2, RPL13,RPL13A,RPL14,RPL15,RPL17,RPL18,RPL18A,RPL19,RPL21,RPL22,RPL23,RPL23A, RPL24,RPL26,RPL27,RPL27A,RPL28,RPL29,RPL30,RPL31,RPL32,RPL34,RPL35,RPL35A, RPL36,RPL36A,RPL37,RPL37A,RPL38,RPL39,RPL40,RPL41,RPLP0,RPLPl,RPLP2,RPLP3, UBA52。特別優(yōu)選的是來源于編碼脊椎動物核糖體蛋白(如哺乳動物核糖體蛋白,例如,人 或小鼠核糖體蛋白)的TOP基因的5'UTR的核酸序列。
[0105] 例如,5'UTR元件包含或由這樣的核酸序列組成:所述核酸序列來源于下述核酸 序列的 5'UTR,所述核酸序列為SEQIDNOs:170, 232, 244, 259,1284,1285,1286,1287, 1288,1289,1290,1291,1292,1293,1294,1295,1296,1297,1298,1299,1300,1301,1302, 1303,1304,1305,1306,1307,1308,1309,1310,1311,1312,1313,1314,1315,1316,1317, 1318,1319,1320,1321,1322,1323,1324,1325,1326,1327,1328,1329,1330,1331,1332, 1333,1334,1335,1336,1337,1338,1339,1340,1341,1342,1343,1344,1346,1347,1348, 1349,1350,1351,1352,1353,1354,1355,1356,1357,1358,1359 或 1360 中的任一種;相應(yīng) 的RNA序列,其同源物,或本文所述的其變體,優(yōu)選缺少5'T0P基序。如上文所述,從位置5 延伸至緊接著ATG的5'的核苷酸(其位于所述序列的3')的序列對應(yīng)于所述序列的5'UTR。
[0106] 優(yōu)選地,5'UTR元件包含或由這樣的核酸序列組成:所述核酸序列與SEQIDNOs: 170, 232, 244, 259,1284,1285,1286,1287,1288,1289,1290,1291,1292,1293,1294,1295, 1296,1297,1298,1299,1300,1301,1302,1303,1304,1305,1306,1307,1308,1309,1310, 1311,1312,1313,1314,1315,1316,1317,1318,1319,1320,1321,1322,1323,1324,1325, 1326,1327,1328,1329,1330,1331,1332,1333,1334,1335,1336,1337,1338,1339,1340, 1341,1342,1343,1344,1346,1347,1348,1349,1350,1351,1352,1353,1354,1355,1356, 1357,1358,1359或1360中的任一種;或相應(yīng)的RNA序列的核酸序列的5'UTR具有至少約 40%,優(yōu)選至少約50%,優(yōu)選至少約60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu)選至 少約90 %,甚至更優(yōu)選至少約95%,甚至更優(yōu)選至少約99 %的同一性,優(yōu)選缺少5'TOP基 序,或者其中,5'UTR元件包含或由這樣的核酸序列的片段組成:所述核酸序列與SEQID NOs:170,232,244,259,1284,1285,1286,1287,1288,1289,1290,1291,1292,1293,1294, 1295,1296,1297,1298,1299,1300,1301,1302,1303,1304,1305,1306,1307,1308,1309, 1310,1311,1312,1313,1314,1315,1316,1317,1318,1319,1320,1321,1322,1323,1324, 1325,1326,1327,1328,1329,1330,1331,1332,1333,1334,1335,1336,1337,1338,1339, 1340,1341,1342,1343,1344,1346,1347,1348,1349,1350,1351,1352,1353,1354,1355, 1356,1357,1358,1359或1360 ;或相應(yīng)的RNA序列的核酸序列的5'UTR具有至少約40%, 優(yōu)選至少約50%,優(yōu)選至少約60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu)選至少約 90%,甚至更優(yōu)選至少約95%,甚至更優(yōu)選至少約99%的同一性,其中,優(yōu)選地,所述片段 如上文所述,即,是表示全長5'UTR的至少20%等的連續(xù)的核苷酸片段,優(yōu)選缺少5'T0P基 序。優(yōu)選地,所述片段表現(xiàn)出至少約20個核苷酸或更多、優(yōu)選至少約30個核苷酸或更多、 更優(yōu)選至少約40個核苷酸或更多的長度。優(yōu)選地,所述片段是本文所述的功能性片段。
[0107] 優(yōu)選地,5'UTR元件包含或由來源于編碼核糖體大蛋白(ribosomalLarge protein,RPL)的TOP基因的5'UTR或來源于編碼核糖體大蛋白(RPL)的TOP基因的5'UTR 的變體的核酸序列組成。例如,5'UTR元件包含或由來源于SEQIDNOs:67, 259,1284-1318, 1344,1346,1348-1354,1357,1461和1462中任一項,相應(yīng)的RNA序列,其同源物或本文所述 的其變體的核酸序列(優(yōu)選缺少5'TOP基序)的5'UTR的核酸序列組成。
[0108] 優(yōu)選地,5'UTR元件包含或由這樣的核酸序列組成:所述核酸序列與SEQID NOs. 67, 259,1284-1318,1344,1346,1348-1354,1357 和 1358 中任一項或相應(yīng)的RNA序列的 核酸序列的5 'UTR具有至少約40 %,優(yōu)選至少約50 %,優(yōu)選至少約60 %,優(yōu)選至少約70 %, 更優(yōu)選至少約80 %,更優(yōu)選至少約90 %,甚至更優(yōu)選至少約95 %,甚至更優(yōu)選至少約99 % 的同一'I"生,優(yōu)選缺少5'TOP基序,或者,其中,至少一個5'UTR元件包含或由這樣的核酸序 列的片段組成:所述核酸序列與SEQIDNOs:67, 259,1284-1318,1344,1346,1348-1354, 1357,1461和1462中任一項或相應(yīng)的RNA序列的核酸序列的5'UTR具有至少約40%,優(yōu)選 至少約50%,優(yōu)選至少約60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu)選至少約90%, 甚至更優(yōu)選至少約95 %,甚至更優(yōu)選至少約99 %的同一性,其中,優(yōu)選地,所述片段如上文 所述,即,是表示全長5'UTR的至少20%等的連續(xù)的核苷酸片段(優(yōu)選缺少5'TOP基序)。 優(yōu)選地,所述片段表現(xiàn)出至少約20個核苷酸或更多、優(yōu)選至少約30個核苷酸或更多、更優(yōu) 選至少約40個核苷酸或更多的長度。優(yōu)選地,所述片段是本文所述的功能性片段。
[0109] 在特別優(yōu)選的實施方案中,5'UTR元件包含或由這樣的核酸序列組成:所述 核酸序列來源于下述的5'UTR:核糖體大蛋白32基因(RPL32),核糖體大蛋白35基因 (RPL35),核糖體大蛋白21基因(RPL21),ATP合酶,H+轉(zhuǎn)運,線粒體Fl復(fù)合物,a亞基 1,心?。ˋTP5A1)基因,羥基固醇(17-0)脫氫酶4基因(HSD17B4),雄激素誘導(dǎo)的1基因 (AIGl),細胞色素c氧化酶亞基VIc基因(C0X6C),或N-酰基鞘氨醇酰胺基水解酶(酸性 神經(jīng)酰胺酶)1基因(ASAHl),或來源于其變體,優(yōu)選來源于脊椎動物核糖體蛋白Large32 基因(RPL32),脊椎動物核糖體大蛋白35基因(RPL35),脊椎動物核糖體大蛋白21基因 (RPL21),脊椎動物ATP合酶,H+轉(zhuǎn)運,線粒體Fl復(fù)合物,a亞基1,心?。ˋTP5A1)基因,脊 椎動物羥基固醇(17-0 )脫氫酶4基因(HSD17B4),脊椎動物雄激素誘導(dǎo)的1基因(AIGl), 脊椎動物細胞色素c氧化酶亞基VIc基因(C0X6C),或脊椎動物N-?;拾贝减0坊?酶(酸性神經(jīng)酰胺酶)1基因(ASAHl)或來源于其變體,更優(yōu)選來源于哺乳動物核糖體大蛋 白32基因(RPL32),核糖體大蛋白35基因(RPL35),核糖體大蛋白21基因(RPL21),哺乳動 物ATP合酶,H+轉(zhuǎn)運,線粒體Fl復(fù)合物,a亞基1,心?。ˋTP5A1)基因,哺乳動物羥基固醇 (17-P)脫氫酶4基因(HSD17B4),哺乳動物雄激素誘導(dǎo)的1基因(AIGl),哺乳動物細胞色 素c氧化酶亞基VIc基因(C0X6C),或哺乳動物N-?;拾贝减0坊饷福ㄋ嵝陨窠?jīng)酰胺 酶)1基因(ASAHl)或來源于其變體,最優(yōu)選來源于人核糖體大蛋白32基因(RPL32),人核 糖體大蛋白35基因(RPL35),人核糖體大蛋白21基因(RPL21),人ATP合酶,H+轉(zhuǎn)運,線粒 體Fl復(fù)合物,a亞基1,心?。ˋTP5A1)基因,人羥基固醇(17-0)脫氫酶4基因(HSD17B4), 人雄激素誘導(dǎo)的1基因(AIGl),人細胞色素c氧化酶亞基VIc基因(C0X6C),或人N-酰基 鞘氨醇酰胺基水解酶(酸性神經(jīng)酰胺酶)1基因(ASAHl)或來源于其變體,其中優(yōu)選所述 5'UTR元件不包含所述基因的5'TOP。
[0110] 因此,在特別優(yōu)選的實施方案中,所述5'UTR元件包含或由這樣的核酸序列組成: 所述核酸序列與SEQIDNo. 1368或SEQIDN0sl452-1460或相應(yīng)的RNA序列的核酸序列具 有至少約40 %,優(yōu)選至少約50 %,優(yōu)選至少約60 %,優(yōu)選至少約70 %,更優(yōu)選至少約80 %, 更優(yōu)選至少約90 %,甚至更優(yōu)選至少約95 %,甚至更優(yōu)選至少約99 %的同一性,或者其中, 所述至少一種5'UTR元件包含或由這樣的核酸序列的片段組成:所述核酸序列與SEQID No. 1368或SEQIDNOs1452-1460的核酸序列具有至少約40%,優(yōu)選至少約50%,優(yōu)選至 少約60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu)選至少約90%,甚至更優(yōu)選至少約 95%,甚至更優(yōu)選至少約99%的同一性,其中,優(yōu)選地,所述片段如上文所述,S卩,是表示全 長5'UTR的至少20%等的連續(xù)的核苷酸的片段。優(yōu)選地,所述片段表現(xiàn)出至少約20個核 苷酸或更多、優(yōu)選至少約30個核苷酸或更多、更優(yōu)選至少約40個核苷酸或更多的長度。優(yōu) 選地,所述片段是本文所述的功能性片段。
[0111] 優(yōu)選地,所述至少一個5'UTR元件表現(xiàn)出至少約20個核苷酸或更多、優(yōu)選至少 約30個核苷酸或更多、更優(yōu)選至少約40個核苷酸或更多的長度。然而,如果所述人工核 酸分子的5'UTR元件相當(dāng)短,其可以是優(yōu)選的。因此,其可以具有少于約200個、優(yōu)選少于 150個、更優(yōu)選少于100個核苷酸的長度。例如,5'UTR可以具有少于約25,30,35,40,45, 50,55,60,65, 70,80,85,90,95,100,105,110,115,120,125,130,135,140,145,150,155, 160,165,170,175,180,185,190,195, 200個核苷酸的長度。優(yōu)選地,5'UTR元件可以具有 約 20-25,26-30,31-35, 36-40,41-45,46-50,51-55,56-60,61-65,66-70, 71-80,81-85, 86-90,91-95,96-100,101-105,106-110,111-115,116-120,121-125,126-130,131-135, 136-140,141-145,146-150,151-155,156-160,161-165,166-170,171-175,176-180, 181-185,186-190,191-195,196-200或更多個核苷酸的長度。例如,5'UTR元件可以具有約 20, 26, 31,36,41,46, 51,56,61,66,71,81,86,91,96,101,106,111,116,121,126,131,136, 141,146,151,156,161,166,171,176,181,186,191 或 196 個核苷酸的長度。優(yōu)選地,5'UTR 元件可以具有約20, 30,40個以上至少于約200個核苷酸的長度,更優(yōu)選地約20, 30,40個 以上至少于約150個核苷酸的長度,最優(yōu)選的約20, 30,40個以上至少于約100個核苷酸的 長度。
[0112] 優(yōu)選的5'UTR元件來源于選自下述的TOP基因的5'UTR:RPSA,RPS2,RPS3,RPS3A, RPS4,RPS5,RPS6,RPS7,RPS8,RPS9,RPS10,RPSlI,RPS12,RPS13,RPS14,RPS15,RPS15A, RPS16,RPS17,RPS18,RPS19,RPS20,RPS21,RPS23,RPS24,RPS25,RPS26,RPS27,RPS27A, RPS28,RPS29,RPS30,RPL3,RPL4,RPL5,RPL6,RPL7,RPL7A,RPL8,RPL9,RPLlO,RPLIOA, RPLlI,RPL12,RPL13,RPL13A,RPL14,RPL15,RPL17,RPL18,RPL18A,RPL19,RPL21,RPL22, RPL23,RPL23A,RPL24,RPL26,RPL27,RPL27A,RPL28,RPL29,RPL30,RPL31,RPL32,RPL34, RPL35,RPL35A,RPL36,RPL36A,RPL37,RPL37A,RPL38,RPL39,RPL40,RPL41,RPLPO,RPLPl, RPLP2,RPLP3,RPLPO,RPLPl,RPLP2,EEFlAl,EEF1B2,EEF1D,EEF1G,EEF2,EIF3E,EIF3F, EIF3H,EIF2S3,EIF3C,EIF3K,EIF3EIP,EIF4A2,PABPCl,HNRNPA1,TPTl,TUBBl,UBA52,NPMl, ATP5G2,GNB2L1,NME2,UQCRB或選自其變體。
[0113] 在一些實施方案中,所述人工核酸分子包含5'UTR元件,所述5'UTR元件包含或 由這樣的核酸序列組成,所述核酸序列來源于脊椎動物TOP基因(如哺乳動物,例如,人TOP 基因)的 5'UTR,所述脊椎動物TOP基因選自:RPSA,RPS2,RPS3,RPS3A,RPS4,RPS5,RPS6, RPS7,RPS8,RPS9,RPS10,RPS11,RPS12,RPS13,RPS14,RPS15,RPS15A,RPS16,RPS17,RPS18, RPS19,RPS20,RPS21,RPS23,RPS24,RPS25,RPS26,RPS27,RPS27A,RPS28,RPS29,RPS30, RPL3,RPL4,RPL5,RPL6,RPL7,RPL7A,RPL8,RPL9,RPLlO,RPLl0A,RPLlI,RPLl2,RPLl3, RPL13A,RPL14,RPL15,RPL17,RPL18,RPL18A,RPL19,RPL21,RPL22,RPL23,RPL23A,RPL24, RPL26,RPL27,RPL27A,RPL28,RPL29,RPL30,RPL31,RPL32,RPL34,RPL35,RPL35A,RPL36, RPL36A,RPL37,RPL37A,RPL38,RPL39,RPL40,RPL41,RPLPO,RPLPl,RPLP2,RPLP3,RPLP0, RPLPl,RPLP2,EEFlAl,EEF1B2,EEF1D,EEF1G,EEF2,EIF3E,EIF3F,EIF3H,EIF2S3,EIF3C, EIF3K,EIF3EIP,EIF4A2,PABPCl,HNRNPA1,TPTl,TUBBl,UBA52,NPMl,ATP5G2,GNB2L1,NME2, UQCRB或選自其變體,其中優(yōu)選地,所述5 'UTR元件不包含所述基因的TOP基序或5 'TOP,并 且其中,任選地,所述5'UTR元件在其5' -端起始于位于5'端寡嘧啶片段(TOP)下游的位 置1,2, 3,4, 5,6, 7,8,9或10的核苷酸,并且其中進一步任選地,來源于TOP基因的5'UTR 的所述5'UTR元件終止于位于其所來源的基因的起始密碼子(A(U/T)G)上游的位置1,2, 3,4,5,6,7,8,9 或 10 的核苷酸。
[0114] 在特別優(yōu)選的實施方案中,所述人工核酸分子還包含組蛋白莖環(huán)。
[0115] 因此,特別優(yōu)選的是,本發(fā)明所述的人工核酸分子包含:
[0116]a.至少一個5' -非翻譯區(qū)元件(5'UTR元件),其包含或由來源于TOP基因的 5'UTR或來源于TOP基因的5'UTR的變體的核酸序列組成,如上文所述;
[0117]b?至少一個可讀框(ORF);和
[0118]c.至少一個組蛋白莖環(huán)。
[0119] 上述5'UTR元件與組蛋白莖環(huán)的組合可以在提供持久的且還可能是增強的RNA分 子的翻譯的方面具有特別有益的作用。
[0120] 在本發(fā)明的情形中,所述組蛋白莖環(huán)典型地來源于組蛋白基因,并且包含兩個相 鄰的完全或部分反向互補序列的分子內(nèi)堿基配對,由此形成莖環(huán)。莖環(huán)可以存在于單鏈DNA 中,或者,更常見地,存在于RNA中。還已知結(jié)構(gòu)是發(fā)夾或發(fā)夾環(huán),并且通常由連續(xù)序列內(nèi)的 莖和(末端的)環(huán)組成,其中所述莖由兩個由如間隔臂的短序列分隔的相鄰的完全或部分 反向互補的序列形成,所述短序列建立所述莖環(huán)結(jié)構(gòu)的環(huán)。所述兩個相鄰的完全或部分反 向互補的序列可以定義為,例如,莖環(huán)元件莖1和莖2。當(dāng)這兩個相鄰的完全或部分反向互 補的序列,例如,莖環(huán)元件莖1和莖2,彼此形成堿基配對時,形成雙鏈的核酸序列,其在其 末端包含由位于連續(xù)序列上的莖環(huán)元件莖1和莖2之間的短序列形成的不配對的環(huán),從而 形成莖環(huán)。不配對的環(huán)由此典型地表示核酸不能與這些莖環(huán)元件中的任一個堿基配對的區(qū) 域。形成的棒棒糖-形狀的結(jié)構(gòu)是多種RNA二級結(jié)構(gòu)的主要結(jié)構(gòu)單元。因此,莖環(huán)結(jié)構(gòu)的形 成依賴于產(chǎn)生的莖和環(huán)區(qū)域的穩(wěn)定性,其中第一前提條件典型地是存在可以自身向后折疊 形成配對雙鏈的序列。配對的莖環(huán)元件的穩(wěn)定性由長度、其包含的錯配或凸起的數(shù)量(少 量錯配典型地是可耐受的,尤其是在長的雙鏈片段中)以及配對區(qū)的堿基組成決定。在本 發(fā)明的情形中,最佳環(huán)長度是3-10個堿基,更優(yōu)選3-8個,3-7個,3-6個或甚至更優(yōu)選4-5 個喊基,并且最優(yōu)選4個喊基。
[0121] 優(yōu)選地,所述至少一個組蛋白莖環(huán)與ORF功能相關(guān)。這意指所述至少一個組蛋白 莖環(huán)優(yōu)選地位于所述人工核酸分子內(nèi),以使其能夠發(fā)揮其功能,例如,其增加來自O(shè)RF的蛋 白生產(chǎn)或穩(wěn)定所述人工核酸分子的功能。
[0122] 優(yōu)選地,所述組蛋白莖環(huán)位于ORF的3'。例如,所述組蛋白莖環(huán)可以直接連接或通 過接頭連接在ORF的3'-端,例如,通過核苷酸片段,如2,4,6,8,10個等的核苷酸的片段連 接,例如,其包含一個或多個限制性位點,或所述組蛋白莖環(huán)可以位于在ORF的3'的其他結(jié) 構(gòu)之內(nèi)、或之間或下游,諸如在3'UTR元件之內(nèi),或在聚腺苷酸序列與聚胞苷酸序列之間, 或在聚腺苷酸和/或聚胞苷酸序列的下游,或者所述組蛋白莖環(huán)可以位于人工核酸分子的 3' _端。術(shù)語"位于3' -端"還包括這樣的實施方案,其中所述組蛋白莖環(huán)在3' -方向上 接著例如在限制酶切割后保留的少量核苷酸。
[0123] 優(yōu)選地,這樣選擇并放置所述5'UTR元件和所述組蛋白莖環(huán),以使其對由人工核 酸分子的ORF的蛋白生產(chǎn)發(fā)揮至少加合功能,優(yōu)選協(xié)同功能。優(yōu)選地,由ORF的蛋白生產(chǎn)通 過所述5'UTR元件和所述組蛋白莖環(huán)以加合的方式、優(yōu)選以協(xié)同方式增力口。優(yōu)選地,與如果 單純加合5'UTR元件與組蛋白莖環(huán)的蛋白生產(chǎn)增加作用將預(yù)測的蛋白量相比,在特定時間 點在起始ORF的表達后(例如,在轉(zhuǎn)染測試細胞系后)由ORF編碼的蛋白(如報道蛋白,例 如,熒光素酶)的蛋白量至少是相同的,優(yōu)選更高。例如,所述加合作用,優(yōu)選協(xié)同作用可以 通過下述測定來確定。產(chǎn)生四種包含編碼例如報道蛋白(如熒光素酶)的ORF的人工核酸 分子,例如,mRNAs,即,⑴缺少5'UTR元件和組蛋白莖環(huán)(EO),(ii)包含來源于TOP基因 的5'UTR或其變體的5'UTR元件(El),(iii)包含組蛋白莖環(huán)(E2),和(iv)包含5'UTR 元件與組蛋白莖環(huán)二者(E1E2)。例如,通過轉(zhuǎn)染測試細胞系,如哺乳動物細胞系,例如,HELA 細胞,或原代細胞,例如,HDF細胞,起始包含在人工核酸分子中的ORF的表達。在起始表達 后特定的時間點取樣,例如,在6小時、24小時、48小時和/或72小時后取樣,并且測量由 包含在人工核酸分子中的ORF的表達產(chǎn)生的蛋白的量,例如,通過ELISA測定或熒光素酶檢 測來測量,這取決于由ORF編碼的蛋白的類型。如果3'UTR元件與5'UTR元件的作用是單 純加合的(PPA),在起始表達后的特定時間點由構(gòu)建體E1E2獲得的蛋白的預(yù)測量可以如下 述計算:
[0124]PPAx= (Elx-EOx)+ (E2X-E0X)+EOx,
[0125] EO是由構(gòu)建體EO(缺少5'UTR和組蛋白莖環(huán))獲得的蛋白的量,El是由構(gòu)建體El 獲得的蛋白的量,E2是由構(gòu)建體E2獲得的蛋白的量,并且x是在起始表達后的時間點。如 果E1E2X =PPAx,則對增加蛋白生產(chǎn)的作用是加合的,并且如果E1E2X >PPAx,則是本發(fā)明的 意義中的協(xié)同的,其中E1E2X是由構(gòu)建體E1E2在時間點X獲得的蛋白的量。優(yōu)選地,在起始 表達后的給定時間點,如在起始表達后24小時、48小時或72小時,E1E2至少是PPA的I.O 倍,更優(yōu)選至少I. 1倍,更優(yōu)選至少1. 3倍,更優(yōu)選至少1. 5倍,甚至更優(yōu)選至少1. 75倍。
[0126] 因此,在優(yōu)選的實施方案中,本發(fā)明提供包含下述的人工核酸分子:(a.)至少一 個5'UTR元件,其包含或由來源于TOP基因的5'UTR或來源于TOP基因的5'UTR的變體 的核酸序列組成,如上文所述;(b.)至少一個可讀框(ORF);和(c.)至少一個如本文定義 的組蛋白莖環(huán),其中所述組蛋白莖環(huán)與所述5'UTR元件至少加合作用,優(yōu)選協(xié)同作用,以增 加由所述ORF的蛋白生產(chǎn),優(yōu)選地,其中,在起始ORF表達后給定的時間點,例如,起始表達 后24小時,優(yōu)選48小時,E1E2彡P(guān)PA,優(yōu)選地,E1E2至少是PPA,更優(yōu)選地,E1E2是PPA的 至少I. 1倍,更優(yōu)選地E1E2是PPA的至少1. 3倍,甚至更優(yōu)選地,其中E1E2是PPA的至少 1. 5倍,其中E1E2和PPA如上文所述。
[0127] 此外。優(yōu)選地,所述至少一個組蛋白莖環(huán)和所述至少一個5'UTR元件對特定時間 跨度(如起始表達后24小時、48小時或72小時)由所述人工核酸分子產(chǎn)生的總蛋白生產(chǎn)具 有至少加合作用,優(yōu)選協(xié)同作用。所述加合作用,優(yōu)選協(xié)同作用,可以如上文所述確定,區(qū)別 在于,如果作用是加合性的時,將關(guān)于E1E2所預(yù)測的隨時間的蛋白量的曲線下面積(AUC) 與關(guān)于E1E2測量的實際AUC進行比較。
[0128] 在本發(fā)明的優(yōu)選實施方案中,本發(fā)明的人工核酸分子包含或編碼:(a.)至少一個 如上文所述的5'UTR元件,(b.)至少一個可讀框;和(c.)至少一個組蛋白莖環(huán),優(yōu)選是下 述式(I)或(II)中的至少一個所述:
[0129] 式(I)(不具有莖邊界元件的莖環(huán)序列):
[0130]
【權(quán)利要求】
1. 人工核酸分子,其包含: a. 至少一個5'-非翻譯區(qū)元件(5'UTR元件),其包含來源于TOP基因的5'UTR或來 源于TOP基因的5' UTR的變體的核酸序列或由來源于TOP基因的5' UTR或來源于TOP基 因的5' UTR的變體的核酸序列組成;和 b. 至少一個可讀框(ORF)。
2. 根據(jù)權(quán)利要求1所述的人工核酸分子,其還包含: c. 至少一個組蛋白莖環(huán)。
3. 根據(jù)權(quán)利要求1或2所述的人工核酸分子,其中所述5'UTR元件與所述可讀框是異 源的。
4. 根據(jù)權(quán)利要求1-3中任一項所述的人工核酸分子,其中所述5'UTR元件適于增加來 自所述人工核酸分子的蛋白生產(chǎn)。
5. 根據(jù)權(quán)利要求2-4中任一項所述的人工核酸分子,其中所述5'UTR元件與所述組蛋 白莖環(huán)一起作用,優(yōu)選至少加合地,增加來自所述人工核酸分子的蛋白生產(chǎn)。
6. 根據(jù)權(quán)利要求1-5中任一項所述的人工核酸分子,其中所述5' UTR元件不包含 TOP-基序,優(yōu)選地,其中來源于TOP基因的5' UTR的所述核酸序列,優(yōu)選所述5' UTR元件, 在其5' -端起始于位于聚嘧啶片段下游的位置1,2, 3,4, 5,6, 7,8,9或10的核苷酸。
7. 根據(jù)權(quán)利要求1-6中任一項所述的人工核酸分子,其中來源于TOP基因的5'UTR的 所述核酸序列,優(yōu)選所述5' UTR元件,在其3' -端終止于位于其所來源的基因的起始密碼 子上游的位置1,2, 3,4, 5,6, 7,8,9或10的核苷酸。
8. 根據(jù)權(quán)利要求1-7中任一項所述的人工核酸分子,其中所述5'UTR元件不包含起始 密碼子或可讀框。
9. 根據(jù)權(quán)利要求1-8中任一項所述的人工核酸分子,其中來源于TOP基因的5'UTR的 所述核酸序列是來源于真核TOP基因的5' UTR或是來源于其變體,優(yōu)選來源于植物或動物 TOP基因的5' UTR或來源于其變體,更優(yōu)選來源于脊索動物TOP基因的5' UTR或來源于其 變體,甚至更優(yōu)選來源于脊椎動物TOP基因的5'UTR或來源于其變體,最優(yōu)選來源于哺乳動 物TOP基因的5' UTR,如人TOP基因的5' UTR,或來源于其變體。
10. 根據(jù)權(quán)利要求2-9中任一項所述的人工核酸分子,其中所述至少一個組蛋白莖環(huán) 是選自下式(I)或(II):
其中: 莖1或莖2邊界元件Np6是1-6個、優(yōu)選2-6個、更優(yōu)選2-5個、甚至更優(yōu)選3-5個、最 優(yōu)選4-5個或5個N的連續(xù)序列,其中每個N彼此獨立地選自下述核苷酸:所述核苷酸選自 A,U,T,G和C,或其核苷酸類似物; 莖I [Nch2GN3J與元件莖2反向互補或部分反向互補,并且是5-7個核苷酸的連續(xù)序 列; 其中Nch2是0-2個、優(yōu)選0-1個、更優(yōu)選1個N的連續(xù)序列,其中每個N彼此獨立地選 自下述核苷酸:所述核苷酸選自A,U,T,G和C或其核苷酸類似物; 其中N3_5是3-5個、優(yōu)選4-5個、更優(yōu)選4個N的連續(xù)序列,其中每個N彼此獨立地選 自下述核苷酸:所述核苷酸選自A,U,T,G和C或其核苷酸類似物,并且 其中G是鳥苷或其類似物,并且可以任選地被胞苷或其類似物替代,條件是其在莖2中 的互補核苷酸胞苷被鳥苷替代; 環(huán)序列[Nch4(UA)Nch4]位于元件莖1和莖2之間,并且是3-5個核苷酸、更優(yōu)選4個核 苷酸的連續(xù)序列; 其中每個Nch4彼此獨立地是0-4個、優(yōu)選1-3個、更優(yōu)選1-2個N的連續(xù)序列,其中每 個N彼此獨立地選自下述核苷酸:所述核苷酸選自A,U,T,G和C或其核苷酸類似物;并且 其中U/T表示尿苷,或任選地胸苷; 莖2[Np5CNtlJ與元件莖1反向互補或部分反向互補,并且是5-7個核苷酸的連續(xù)序 列; 其中N3_5是3-5個、優(yōu)選4-5個、更優(yōu)選4個N的連續(xù)序列,其中每個N彼此獨立地選 自下述核苷酸:所述核苷酸選自A,U,T,G和C,或其核苷酸類似物; 其中Nch2是0-2個、優(yōu)選0-1個、更優(yōu)選1個N的連續(xù)序列,其中每個N彼此獨立地選 自下述核苷酸:所述核苷酸選自A,U,T,G和C,或其核苷酸類似物;并且 其中C是胞苷或其類似物,并且可以任選地被鳥苷或其類似物替代,條件是其在莖1中 的互補核苷酸鳥苷被胞苷替代; 其中 莖1和莖2能夠彼此堿基配對 形成反向互補序列,其中堿基配對可以發(fā)生在莖1與莖2之間,或者 形成部分反向互補的序列,其中不完全的堿基配對可以發(fā)生在莖1和莖2之間。
11.根據(jù)權(quán)利要求2-10中任一項所述的人工核酸分子,其中所述至少一個組蛋白莖環(huán) 選自下式(Ia)或(IIa)中的至少一個:
式(Ia)(不具有莖邊界元件的莖環(huán)序列)
式(IIa)(具有莖邊界元件的莖環(huán)序列)。
12. 根據(jù)權(quán)利要求1-11中任一項所述的人工核酸分子,其還包含: d. 聚腺苷酸序列和/或聚腺苷酸化信號。
13. 根據(jù)權(quán)利要求12所述的人工核酸分子,其中所述聚腺苷酸序列包含下述或由下述 組成:約25至約400個腺苷核苷酸的序列,優(yōu)選約50至約400個腺苷核苷酸的序列,更優(yōu) 選約50至約300個腺苷核苷酸的序列,甚至更優(yōu)選約50至約250個腺苷核苷酸的序列,最 優(yōu)選約60至約250個腺苷核苷酸的序列。
14. 根據(jù)權(quán)利要求12或13所述的人工核酸分子,其中所述聚腺苷酸化信號包含共有序 列 NN(U/T) ANA,其中 N = A 或 U,優(yōu)選為 AA (U/T) AAA 或 A (U/T) (U/T) AAA。
15. 根據(jù)權(quán)利要求1-14中任一項所述的人工核酸分子,其還包含: e. 聚胞苷酸序列。
16. 根據(jù)權(quán)利要求15所述的人工核酸分子,其中所述聚胞苷酸序列包含下述,或優(yōu)選 由下述組成:約10至約200個胞苷核苷酸,更優(yōu)選約10至約100個胞苷核苷酸,更優(yōu)選約 10至約50個胞苷核苷酸,甚至更優(yōu)選約20至約40個胞苷核苷酸。
17. 根據(jù)權(quán)利要求1-16中任一項所述的人工核酸分子,其還包含: f. 至少一個3' UTR元件。
18. 根據(jù)權(quán)利要求17所述的人工核酸分子,其中所述至少一個3'UTR元件包含下述核 酸序列或由下述核酸序列組成:所述核酸序列來源于提供穩(wěn)定的mRNA的基因的3' UTR或 來源于提供穩(wěn)定的mRNA的基因的3' UTR的變體。
19. 根據(jù)權(quán)利要求17或18所述的人工核酸分子,其中所述至少一個3' UTR元件和所 述至少一個5' UTR元件至少加合作用,優(yōu)選協(xié)同作用增加來自所述人工核酸分子的蛋白生 產(chǎn)。
20. 根據(jù)權(quán)利要求1-19中任一項所述的人工核酸分子,其中所述5'UTR元件包含下述 核酸序列或由下述核酸序列組成:所述核酸序列是來源于選自由SEQ ID NOs. 1-1363, SEQ ID NO. 1435, SEQ ID NO. 1461或SEQ ID NO. 1462組成的組的核酸序列,或來源于SEQ ID NOs. 1-1363, SEQ ID NO. 1435, SEQ ID NO. 1461 或 SEQ ID NO. 1462 中任一項的同源物,或 來源于其變體。
21. 根據(jù)權(quán)利要求1-20中任一項所述的人工核酸分子,其中所述5' UTR元件包含 下述核酸序列或由下述核酸序列組成:所述核酸序列與選自SEQ ID NOs. 1-1363, SEQ ID NO. 1435, SEQ ID NO. 1461或SEQ ID NO. 1462的核酸序列或與相對應(yīng)的RNA序列具有至少 約40%,優(yōu)選至少約50%,優(yōu)選至少約60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu)選 至少約90%,甚至更優(yōu)選至少約95 %,甚至更優(yōu)選至少約99 %的同一性,或者其中所述至 少一個5' UTR元件包含下述或由下述組成:與選自SEQ ID NOs. 1-1363, SEQ ID NO. 1435, SEQ ID NO. 1461或SEQ ID NO. 1462的核酸序列或與相對應(yīng)的RNA序列具有至少約40%, 優(yōu)選至少約50%,優(yōu)選至少約60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu)選至少約 90 %,甚至更優(yōu)選至少約95 %,甚至更優(yōu)選至少約99 %的同一性,優(yōu)選缺少5' TOP基序的核 酸序列的片段。
22. 根據(jù)權(quán)利要求1-21中任一項所述的人工核酸分子,其中所述5' UTR元件包含下 述核酸序列或由下述核酸序列組成:所述核酸序列來源于編碼核糖體蛋白的TOP基因的 5'UTR或來源于編碼核糖體蛋白的TOP基因的5'UTR的變體,優(yōu)選來源于SEQ ID N0s:170, 232,244,259,1284,1285,1286,1287,1288,1289,1290,1291,1292,1293,1294,1295,1296, 1297,1298,1299,1300,1301,1302,1303,1304,1305,1306,1307,1308,1309,1310,1311, 1312,1313,1314,1315,1316,1317,1318,1319,1320,1321,1322,1323,1324,1325,1326, 1327,1328,1329,1330,1331,1332,1333,1334,1335,1336,1337,1338,1339,1340,1341, 1342,1343,1344,1346,1347,1348,1349,1350,1351,1352,1353,1354,1355,1356,1357, 1358,1359或1360中任一項的核酸序列的5'UTR ;相對應(yīng)的RNA序列,其同源物,或其變體, 優(yōu)選缺少5' TOP基序。
23. 根據(jù)權(quán)利要求1-22中任一項所述的人工核酸分子,其中所述5' UTR元件包含 下述核酸序列或由下述核酸序列組成:所述核酸序列與SEQ ID N0s:170,232,244,259, 1284,1285,1286,1287,1288,1289,1290,1291,1292,1293,1294,1295,1296,1297,1298, 1299,1300,1301,1302,1303,1304,1305,1306,1307,1308,1309,1310,1311,1312,1313, 1314,1315,1316,1317,1318,1319,1320,1321,1322,1323,1324,1325,1326,1327,1328, 1329,1330,1331,1332,1333,1334,1335,1336,1337,1338,1339,1340,1341,1342,1343, 1344,1346,1347,1348,1349,1350,1351,1352,1353,1354,1355,1356,1357,1358,1359 或 1360中任一項的核酸序列的5' UTR ;或與相對應(yīng)的RNA序列,具有至少約40%,優(yōu)選至少 約50%,優(yōu)選至少約60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu)選至少約90%,甚至 更優(yōu)選至少約95 %,甚至更優(yōu)選至少約99 %的同一性,優(yōu)選缺少5' TOP基序,或者,其中所 述至少一個5'UTR元件包含下述或由下述組成:與SEQ ID NOs :170, 232, 244, 259,1284, 1285,1286,1287,1288,1289,1290,1291,1292,1293,1294,1295,1296,1297,1298,1299, 1300,1301,1302,1303,1304,1305,1306,1307,1308,1309,1310,1311,1312,1313,1314, 1315,1316,1317,1318,1319,1320,1321,1322,1323,1324,1325,1326,1327,1328,1329, 1330,1331,1332,1333,1334,1335,1336,1337,1338,1339,1340,1341,1342,1343,1344, 1346,1347,1348,1349,1350,1351,1352,1353,1354,1355,1356,1357,1358,1359 或 1360 的核酸序列的5' UTR ;或與相對應(yīng)的RNA序列,具有至少約40%,優(yōu)選至少約50%,優(yōu)選至 少約60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu)選至少約90%,甚至更優(yōu)選至少約 95 %,甚至更優(yōu)選至少約99 %的同一性,優(yōu)選缺少5 ' TOP基序的核酸序列的片段。
24. 根據(jù)權(quán)利要求1-23中任一項所述的人工核酸分子,其中所述5'UTR元件來源于編 碼核糖體大蛋白(RPL)的TOP基因的5' UTR或來源于編碼核糖體大蛋白(RPL)的TOP基 因的 5' UTR 的變體,優(yōu)選來源于 SEQ ID NOs :67, 259,1284-1318,1344,1346,1348-1354, 1357,1461和1462中任一項的核酸序列的5'UTR,相對應(yīng)的RNA,其同源物,或其變體,優(yōu)選 缺少5' TOP基序。
25. 根據(jù)權(quán)利要求1-24中任一項所述的人工核酸分子,其中所述5'UTR元件包含下述 核酸序列或由下述核酸序列組成:所述核酸序列與SEQ ID NOs :67, 259,1284-1318,1344, 1346,1348-1354,1357,1461和1462中任一項的核酸序列的5' UTR,或與相對應(yīng)的RNA序 列,具有至少約40%,優(yōu)選至少約50%,優(yōu)選至少約60%,優(yōu)選至少約70%,更優(yōu)選至少約 80%,更優(yōu)選至少約90%,甚至更優(yōu)選至少約95%,甚至更優(yōu)選至少約99%的同一'丨生,優(yōu)選 缺少5' TOP基序,或者,其中所述至少一個5' UTR元件包含下述或由下述組成:與SEQ ID NOs :67, 259,1284-1318,1344,1346,1348-1354,1357,1461 和 1462 中任一項的核酸序列的 5'UTR,或與相對應(yīng)的RNA序列,具有至少約40%,優(yōu)選至少約50%,優(yōu)選至少約60%,優(yōu)選 至少約70 %,更優(yōu)選至少約80 %,更優(yōu)選至少約90 %,甚至更優(yōu)選至少約95 %,甚至更優(yōu)選 至少約99%的同一性,優(yōu)選缺少5' TOP基序的核酸序列的片段。
26. 根據(jù)權(quán)利要求1-25中任一項所述的人工核酸分子,其中所述5'UTR元件包含下述 核酸序列或由下述核酸序列組成:所述核酸序列來源于核糖體大蛋白32基因的5' UTR或 來源于其變體,優(yōu)選來源于脊椎動物核糖體大蛋白32(L32)基因的5'UTR或來源于其變體, 更優(yōu)選來源于哺乳動物核糖體大蛋白32 (L32)基因的5' UTR或來源于其變體,最優(yōu)選來源 于人核糖體大蛋白32 (L32)基因的5' UTR或來源于其變體,其中優(yōu)選所述5' UTR元件,優(yōu) 選所述人工核酸分子不包含所述基因的5' TOP。
27. 根據(jù)權(quán)利要求1-26中任一項所述的人工核酸分子,其中所述5'UTR元件包含下述 核酸序列或由下述核酸序列組成:所述核酸序列與SEQ ID NOs. 1368或1452-1460的核酸 序列,或與相對應(yīng)的RNA序列具有至少約40%,優(yōu)選至少約50%,優(yōu)選至少約60%,優(yōu)選至 少約70 %,更優(yōu)選至少約80 %,更優(yōu)選至少約90 %,甚至更優(yōu)選至少約95 %,甚至更優(yōu)選至 少約99%的同一'丨生,或者其中所述至少一個5' UTR元件包含下述或由下述組成:與SEQ ID NOs. 1368或1452-1460的核酸序列,或與相對應(yīng)的RNA序列具有至少約40%,優(yōu)選至少約 50%,優(yōu)選至少約60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu)選至少約90%,甚至更 優(yōu)選至少約95%,甚至更優(yōu)選至少約99%的同一性的核酸序列的片段。
28. 根據(jù)權(quán)利要求21,23, 25和27中任一項所述的人工核酸分子,其中所述片段由與 全長序列中的連續(xù)核苷酸片段相對應(yīng)的連續(xù)核苷酸片段組成,其表示所述片段所來源的全 長序列的至少20%,優(yōu)選至少30%,更優(yōu)選至少40%,更優(yōu)選至少50%,甚至更優(yōu)選至少 60 %,甚至更優(yōu)選至少70 %,甚至更優(yōu)選至少80 %,并且最優(yōu)選至少90 %。
29. 根據(jù)權(quán)利要求1-28中任一項所述的人工核酸分子,其中所述至少一個5'UTR元件 表現(xiàn)出至少約20個核苷酸的長度,優(yōu)選至少約30個核苷酸的長度,更優(yōu)選至少約40個核 苷酸的長度。
30. 根據(jù)權(quán)利要求1-29中任一項所述的人工核酸分子,其中所述5' UTR元件包含下 述核酸序列或由下述核酸序列組成:所述核酸序列來源于選自RPSA,RPS2, RPS3, RPS3A, RPS4, RPS5, RPS6, RPS7, RPS8, RPS9, RPS10, RPSll,RPS12, RPS13, RPS14, RPS15, RPS15A, RPS16, RPS17, RPS18, RPS19, RPS20, RPS21, RPS23, RPS24, RPS25, RPS26, RPS27, RPS27A, RPS28, RPS29, RPS30, RPL3, RPL4, RPL5, RPL6, RPL7, RPL7A, RPL8, RPL9, RPLlO, RPLl0A, RPLlI, RPL12, RPL13, RPL13A, RPL14, RPL15, RPL17, RPL18, RPL18A, RPL19, RPL21, RPL22, RPL23, RPL23A, RPL24, RPL26, RPL27, RPL27A, RPL28, RPL29, RPL30, RPL31, RPL32, RPL34, RPL35, RPL35A, RPL36, RPL36A, RPL37, RPL37A, RPL38, RPL39, RPL40, RPL41, RPLPO, RPLP1, RPLP2, RPLP3, UBA52的TOP基因的5' UTR,或來源于其變體。
31. 根據(jù)權(quán)利要求2-30中任一項所述的人工核酸分子,其中所述至少一個組蛋白莖環(huán) 包含下述核酸序列或由下述核酸序列組成:所述核酸序列選自由SEQ ID NOs. 1391-1433組 成的組,優(yōu)選選自由SEQ ID NOs. 1403-1433組成的組。
32. 根據(jù)權(quán)利要求2-31中任一項所述的人工核酸分子,其中所述組蛋白莖環(huán)包含下述 核酸序列或由下述核酸序列組成:所述核酸序列與SEQ ID NO. 1433的序列或與相對應(yīng)的 RNA序列具有至少約75 %,優(yōu)選至少約80 %,優(yōu)選至少約85 %,更優(yōu)選至少約90 %,甚至更 優(yōu)選至少約95%的序列同一性,其中,優(yōu)選地,與SEQ ID NO. 1433的序列或與相對應(yīng)的RNA 序列具有至少約75%、優(yōu)選至少約80%、優(yōu)選至少約85%、更優(yōu)選至少約90%、甚至更優(yōu)選 至少約95%的序列同一性的所述序列的位置6、13和20是保守的,S卩,與SEQ ID NO. 1433 或與相對應(yīng)的RNA核苷酸的位置6、13和20的核苷酸相同。
33. 根據(jù)權(quán)利要求17-32中任一項所述的人工核酸分子,其中所述3' UTR元件包含下 述核酸序列或由下述核酸序列組成:所述核酸序列來源于選自由下述組成的組的基因的 3'UTR:白蛋白基因,a-珠蛋白基因,¢-珠蛋白基因,酪氨酸羥化酶基因,脂加氧酶基因 和膠原蛋白a基因,或來源于選自由下述組成的組的基因的3'UTR的變體:白蛋白基因, a-珠蛋白基因,¢-珠蛋白基因,酪氨酸羥化酶基因,脂加氧酶基因和膠原蛋白a基因。
34. 根據(jù)權(quán)利要求17-33中任一項所述的人工核酸分子,其中所述至少一個3' UTR元 件包含下述核酸序列或由下述核酸序列組成:所述核酸序列來源于脊椎動物白蛋白基因 的3' UTR或來源于其變體,優(yōu)選來源于哺乳動物白蛋白基因的3' UTR或來源于其變體,更 優(yōu)選來源于人白蛋白基因的3' UTR或來源于其變體,甚至更優(yōu)選來源于GenBank登記號 NM_000477. 5的人白蛋白基因的3' UTR或來源于其變體。
35. 根據(jù)權(quán)利要求17-33中任一項所述的人工核酸分子,其中所述至少一個3' UTR元 件包含下述核酸序列或由下述核酸序列組成:所述核酸序列來源于脊椎動物a-珠蛋白基 因的3' UTR或來源于其變體,優(yōu)選來源于哺乳動物a -珠蛋白基因的3' UTR或來源于其變 體,更優(yōu)選來源于人a-珠蛋白基因的3' UTR或來源于其變體。
36. 根據(jù)權(quán)利要求17-33中任一項所述的人工核酸分子,其中所述至少一個3' UTR元 件包含下述核酸序列或由下述核酸序列組成:所述核酸序列與選自SEQ ID NOs. 1369-1377 和1434的核酸序列或與相對應(yīng)的RNA序列具有至少約40%,優(yōu)選至少約50%,優(yōu)選至少約 60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu)選至少約90%,甚至更優(yōu)選至少約95%, 甚至更優(yōu)選至少約99%的同一性,或者,其中所述至少一種3' UTR元件包含下述或由下述 組成:與選自SEQ ID NOs. 1369-1377和1434的核酸序列或與相對應(yīng)的RNA序列具有至少約 40%,優(yōu)選至少約50%,優(yōu)選至少約60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu)選至 少約90 %,甚至更優(yōu)選至少約95 %,甚至更優(yōu)選至少約99 %的同一性的核酸序列的片段。
37. 根據(jù)權(quán)利要求36所述的人工核酸分子,其中所述片段由與全長序列中的連續(xù)核苷 酸片段相對應(yīng)的連續(xù)核苷酸片段組成,其表示所述片段所來源的全長序列的至少20 %,優(yōu) 選至少30 %,更優(yōu)選至少40 %,更優(yōu)選至少50 %,甚至更優(yōu)選至少60 %,甚至更優(yōu)選至少 70 %,甚至更優(yōu)選至少80 %,并且最優(yōu)選至少90 %。
38. 根據(jù)權(quán)利要求17-37中任一項所述的人工核酸分子,其中所述3' UTR元件表現(xiàn)出 至少約40個核苷酸的長度,優(yōu)選至少約50個核苷酸的長度,優(yōu)選至少約75個核苷酸的長 度,更優(yōu)選至少約100個核苷酸的長度,甚至更優(yōu)選至少約125個核苷酸的長度,最優(yōu)選至 少約150個核苷酸的長度。
39. 根據(jù)權(quán)利要求1-38中任一項所述的人工核酸分子,其中所述人工核酸分子,優(yōu)選 所述可讀框,是至少部分G/C修飾的,優(yōu)選地,其中,與野生型可讀框相比,所述可讀框的G/ C含量增加。
40. 根據(jù)權(quán)利要求1-39中任一項所述的人工核酸分子,其中所述可讀框包含密碼子優(yōu) 化的區(qū)域,優(yōu)選地,其中所述可讀框是密碼子優(yōu)化的。
41. 根據(jù)權(quán)利要求1-40中任一項所述的人工核酸分子,其是RNA,優(yōu)選mRNA分子。
42. -種載體,所述載體包含: a. 至少一個5'-非翻譯區(qū)元件(5'UTR元件),其包含來源于TOP基因的5'UTR或來 源于TOP基因的5' UTR的變體的核酸序列或由來源于TOP基因的5' UTR或來源于TOP基 因的5' UTR的變體的核酸序列組成;和 b. 至少一個可讀框(ORF)和/或至少一個克隆位點。
43. 根據(jù)權(quán)利要求42所述的載體,其還包含: c. 至少一個組蛋白莖環(huán)。
44. 根據(jù)權(quán)利要求42或43所述的載體,其中所述5'UTR元件與所述可讀框是異源的。
45. 根據(jù)權(quán)利要求42-44中任一項所述的載體,其中所述5' UTR元件適于增加來自所 述載體的蛋白生產(chǎn)。
46. 根據(jù)權(quán)利要求43-45中任一項所述的載體,其中所述5' UTR元件與所述組蛋白莖 環(huán)一起作用,優(yōu)選至少加合地,增加來自所述載體的蛋白生產(chǎn)。
47. 根據(jù)權(quán)利要求42-46中任一項所述的載體,其中所述5'UTR元件不包含TOP-基序, 優(yōu)選地,其中來源于TOP基因的5'UTR的所述核酸序列,優(yōu)選所述5'UTR元件,在其5'-端 起始于位于聚嘧啶片段下游的位置1,2, 3,4, 5,6, 7,8,9或10的核苷酸。
48. 根據(jù)權(quán)利要求42-47中任一項所述的載體,其中來源于TOP基因的5' UTR的所述 核酸序列,優(yōu)選所述5' UTR元件,在其3' -端終止于位于其所來源的基因的起始密碼子上 游的位置1,2, 3,4, 5,6, 7,8,9或10的核苷酸。
49. 根據(jù)權(quán)利要求42-48中任一項所述的載體,其中所述5' UTR元件不包含起始密碼 子或可讀框。
50. 根據(jù)權(quán)利要求42-49中任一項所述的載體,其中來源于TOP基因的5' UTR的所述 核酸序列是來源于真核TOP基因的5' UTR或是來源于其變體,優(yōu)選來源于植物或動物TOP 基因的5' UTR或來源于其變體,更優(yōu)選來源于脊索動物TOP基因的5' UTR或來源于其變 體,甚至更優(yōu)選來源于脊椎動物TOP基因的5'UTR或來源于其變體,最優(yōu)選來源于哺乳動物 TOP基因的5' UTR,如人TOP基因的5' UTR,或來源于其變體。
51. 根據(jù)權(quán)利要求43-50中任一項所述的載體,其中所述至少一個組蛋白莖環(huán)是選自 下式⑴或(II): 式(I)(不具有莖邊界元件的莖環(huán)序列):
式(II)(具有莖邊界元件的莖環(huán)序列):
其中: 莖1或莖2邊界元件Np6是1-6個、優(yōu)選2-6個、更優(yōu)選2-5個、甚至更優(yōu)選3-5個、最 優(yōu)選4-5個或5個N的連續(xù)序列,其中每個N彼此獨立地選自下述核苷酸:所述核苷酸選自 A,U,T,G和C,或其核苷酸類似物; 莖I [Nch2GN3J與元件莖2反向互補或部分反向互補,并且是5-7個核苷酸的連續(xù)序 列; 其中Nch2是0-2個、優(yōu)選0-1個、更優(yōu)選1個N的連續(xù)序列,其中每個N彼此獨立地選 自下述核苷酸:所述核苷酸選自A,U,T,G和C或其核苷酸類似物; 其中N3_5是3-5個、優(yōu)選4-5個、更優(yōu)選4個N的連續(xù)序列,其中每個N彼此獨立地選 自下述核苷酸:所述核苷酸選自A,U,T,G和C或其核苷酸類似物,并且 其中G是鳥苷或其類似物,并且可以任選地被胞苷或其類似物替代,條件是其在莖2中 的互補核苷酸胞苷被鳥苷替代; 環(huán)序列[Nch4(UA)Nch4]位于元件莖1和莖2之間,并且是3-5個核苷酸、更優(yōu)選4個核 苷酸的連續(xù)序列; 其中每個Nch4彼此獨立地是0-4個、優(yōu)選1-3個、更優(yōu)選1-2個N的連續(xù)序列,其中每 個N彼此獨立地選自下述核苷酸:所述核苷酸選自A,U,T,G和C或其核苷酸類似物;并且 其中U/T表示尿苷,或任選地胸苷; 莖2[Np5CNtlJ與元件莖1反向互補或部分反向互補,并且是5-7個核苷酸的連續(xù)序 列; 其中N3_5是3-5個、優(yōu)選4-5個、更優(yōu)選4個N的連續(xù)序列,其中每個N彼此獨立地選 自下述核苷酸:所述核苷酸選自A,U,T,G和C,或其核苷酸類似物; 其中Nch2是0-2個、優(yōu)選0-1個、更優(yōu)選1個N的連續(xù)序列,其中每個N彼此獨立地選 自下述核苷酸:所述核苷酸選自A,U,T,G和C,或其核苷酸類似物;并且 其中C是胞苷或其類似物,并且可以任選地被鳥苷或其類似物替代,條件是其在莖1中 的互補核苷酸鳥苷被胞苷替代; 其中 莖1和莖2能夠彼此堿基配對 形成反向互補序列,其中堿基配對可以發(fā)生在莖1與莖2之間,或者 形成部分反向互補的序列,其中不完全的堿基配對可以發(fā)生在莖1和莖2之間。
52.根據(jù)權(quán)利要求43-51中任一項所述的載體,其中所述至少一個組蛋白莖環(huán)選自下 式(Ia)或(IIa)中的至少一個:
式(IIa)(具有莖邊界元件的莖環(huán)序列)。
53. 根據(jù)權(quán)利要求42-52中任一項所述的載體,其還包含: d. 聚腺苷酸序列和/或聚腺苷酸化信號。
54. 根據(jù)權(quán)利要求53所述的載體,其中所述聚腺苷酸序列包含下述或由下述組成:約 25至約400個腺苷核苷酸的序列,優(yōu)選約50至約400個腺苷核苷酸的序列,更優(yōu)選約50至 約300個腺苷核苷酸的序列,甚至更優(yōu)選約50至約250個腺苷核苷酸的序列,最優(yōu)選約60 至約250個腺苷核苷酸的序列。
55. 根據(jù)權(quán)利要求53或54所述的載體,其中所述聚腺苷酸化信號包含共有序列NN (U/ T) ANA,其中 N = A 或 U,優(yōu)選為 AA (U/T) AAA 或 A (U/T) (U/T) AAA。
56. 根據(jù)權(quán)利要求42-55中任一項所述的載體,其還包含: e. 聚胞苷酸序列。
57. 根據(jù)權(quán)利要求56所述的載體,其中所述聚胞苷酸序列包含下述,或優(yōu)選由下述組 成:約10至約200個胞苷核苷酸,更優(yōu)選約10至約100個胞苷核苷酸,更優(yōu)選約10至約50 個胞苷核苷酸,甚至更優(yōu)選約20至約40個胞苷核苷酸。
58. 根據(jù)權(quán)利要求42-57中任一項所述的載體,其還包含: f. 至少一個3' UTR元件。
59. 根據(jù)權(quán)利要求58所述的載體,其中所述至少一個3'UTR元件包含下述核酸序列或 由下述核酸序列組成:所述核酸序列來源于提供穩(wěn)定的mRNA的基因的3' UTR或來源于提 供穩(wěn)定的mRNA的基因的3' UTR的變體。
60. 根據(jù)權(quán)利要求58或59所述的載體,其中所述至少一個3' UTR元件和所述至少一 個5' UTR元件至少加合作用,優(yōu)選協(xié)同作用,增加來自所述載體的蛋白生產(chǎn)。
61. 根據(jù)權(quán)利要求42-60中任一項所述的載體,其中所述5' UTR元件包含下述核酸 序列或由下述核酸序列組成:所述核酸序列是來源于選自由SEQ ID NOs. 1-1363, SEQ ID NO. 1435, SEQ ID NO. 1461或SEQ ID NO. 1462組成的組的核酸序列,或來源于SEQ ID NOs. 1-1363, SEQ ID NO. 1435, SEQ ID NO. 1461 或 SEQ ID NO. 1462 中任一項的同源物,或 來源于其變體。
62. 根據(jù)權(quán)利要求42-61中任一項所述的載體,其中所述5' UTR元件包含下述核酸序 列或由下述核酸序列組成:所述核酸序列與選自SEQ ID NOs. 1-1363, SEQ ID NO. 1435, SEQ ID NO. 1461或SEQ ID NO. 1462的核酸序列,或與相對應(yīng)的RNA序列,具有至少約40%,優(yōu)選 至少約50%,優(yōu)選至少約60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu)選至少約90%, 甚至更優(yōu)選至少約95 %,甚至更優(yōu)選至少約99 %的同一性,優(yōu)選缺少5' TOP基序,或者其 中所述至少一個5' UTR元件包含下述或由下述組成:與選自SEQ ID NOs. 1-1363, SEQ ID NO. 1435, SEQ ID NO. 1461或SEQ ID NO. 1462的核酸序列,或與相對應(yīng)的RNA序列,具有至 少約40%,優(yōu)選至少約50%,優(yōu)選至少約60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu) 選至少約90 %,甚至更優(yōu)選至少約95 %,甚至更優(yōu)選至少約99 %的同一性,優(yōu)選缺少5' TOP 基序的核酸序列的片段。
63. 根據(jù)權(quán)利要求42-62中任一項所述的載體,其中所述5'UTR元件包含下述核酸序列 或由下述核酸序列組成:所述核酸序列來源于編碼核糖體蛋白的TOP基因的5' UTR或來源 于編碼核糖體蛋白的TOP基因的5'UTR的變體,優(yōu)選來源于SEQ ID NOs : 170, 232, 244, 259, 1284,1285,1286,1287,1288,1289,1290,1291,1292,1293,1294,1295,1296,1297,1298, 1299,1300,1301,1302,1303,1304,1305,1306,1307,1308,1309,1310,1311,1312,1313, 1314,1315,1316,1317,1318,1319,1320,1321,1322,1323,1324,1325,1326,1327,1328, 1329,1330,1331,1332,1333,1334,1335,1336,1337,1338,1339,1340,1341,1342,1343, 1344,1346,1347,1348,1349,1350,1351,1352,1353,1354,1355,1356,1357,1358,1359 或 1360中任一項的核酸序列的5 ' UTR ;相對應(yīng)的RNA序列,其同源物,或其如本文所述的變體, 優(yōu)選缺少5' TOP基序。
64. 根據(jù)權(quán)利要求42-63中任一項所述的載體,其中所述5'UTR元件包含下述核酸序列 或由下述核酸序列組成:所述核酸序列與SEQ ID NOs :170, 232, 244, 259,1284,1285,1286, 1287,1288,1289,1290,1291,1292,1293,1294,1295,1296,1297,1298,1299,1300,1301, 1302,1303,1304,1305,1306,1307,1308,1309,1310,1311,1312,1313,1314,1315,1316, 1317,1318,1319,1320,1321,1322,1323,1324,1325,1326,1327,1328,1329,1330,1331, 1332,1333,1334,1335,1336,1337,1338,1339,1340,1341,1342,1343,1344,1346,1347, 1348,1349,1350,1351,1352,1353,1354,1355,1356,1357,1358,1359 或 1360 中任一項的 核酸序列的5'UTR或與相對應(yīng)的RNA序列,具有至少約40 %,優(yōu)選至少約50 %,優(yōu)選至少約 60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu)選至少約90%,甚至更優(yōu)選至少約95%, 甚至更優(yōu)選至少約99%的同一性,優(yōu)選缺少5'T0P基序,或者,其中所述至少一個5'UTR元 件包含下述或由下述組成:與SEQ ID NOs :170,232,244,259,1284,1285,1286,1287,1288, 1289,1290,1291,1292,1293,1294,1295,1296,1297,1298,1299,1300,1301,1302,1303, 1304,1305,1306,1307,1308,1309,1310,1311,1312,1313,1314,1315,1316,1317,1318, 1319,1320,1321,1322,1323,1324,1325,1326,1327,1328,1329,1330,1331,1332,1333, 1334,1335,1336,1337,1338,1339,1340,1341,1342,1343,1344,1346,1347,1348,1349, 1350,1351,1352,1353,1354,1355,1356,1357,1358,1359 或 1360 的核酸序列的 5' UTR 或 與相對應(yīng)的RNA序列,具有至少約40%,優(yōu)選至少約50%,優(yōu)選至少約60%,優(yōu)選至少約 70 %,更優(yōu)選至少約80 %,更優(yōu)選至少約90 %,甚至更優(yōu)選至少約95 %,甚至更優(yōu)選至少約 99%的同一性,優(yōu)選缺少5' TOP基序的核酸序列的片段。
65. 根據(jù)權(quán)利要求42-64中任一項所述的載體,其中所述5'UTR元件來源于編碼核糖體 大蛋白(RPL)的TOP基因的5'UTR或來源于編碼核糖體大蛋白(RPL)的TOP基因的5'UTR 的變體,優(yōu)選來源于 SEQ ID NOs :67, 259,1284-1318,1344,1346,1348-1354,1357,1461 和 1462中任一項的核酸序列的5'UTR,相對應(yīng)的RNA,其同源物,或其變體,優(yōu)選缺少5'TOP基 序。
66. 根據(jù)權(quán)利要求42-65中任一項所述的載體,其中所述5' UTR元件包含下述核酸序 列或由下述核酸序列組成:所述核酸序列與SEQ ID NOs :67, 259,1284-1318,1344,1346, 1348-1354,1357,1461和1462中任一項的核酸序列的5' UTR,或與相對應(yīng)的RNA序列,具 有至少約40 %,優(yōu)選至少約50 %,優(yōu)選至少約60 %,優(yōu)選至少約70 %,更優(yōu)選至少約80 %, 更優(yōu)選至少約90%,甚至更優(yōu)選至少約95%,甚至更優(yōu)選至少約99 %的同一性,優(yōu)選缺 少5' TOP基序,或者,其中所述至少一個5' UTR元件包含下述或由下述組成:與SEQ ID NOs :67, 259,1284-1318,1344,1346,1348-1354,1357,1461 和 1462 中任一項的核酸序列的 5'UTR,或與相對應(yīng)的RNA序列,具有至少約40 %,優(yōu)選至少約50 %,優(yōu)選至少約60 %,優(yōu)選 至少約70 %,更優(yōu)選至少約80 %,更優(yōu)選至少約90 %,甚至更優(yōu)選至少約95 %,甚至更優(yōu)選 至少約99%的同一性,優(yōu)選缺少5' TOP基序的核酸序列的片段。
67. 根據(jù)權(quán)利要求42-66中任一項所述的載體,其中所述5'UTR元件包含下述核酸序列 或由下述核酸序列組成:所述核酸序列來源于核糖體大蛋白32基因的5' UTR,優(yōu)選來源于 脊椎動物核糖體大蛋白32 (L32)基因的5' UTR或來源于其變體,更優(yōu)選來源于哺乳動物核 糖體大蛋白32 (L32)基因的5'UTR或來源于其變體,最優(yōu)選來源于人核糖體大蛋白32 (L32) 基因的5' UTR或來源于其變體,其中優(yōu)選所述5' UTR元件不包含所述基因的5' TOP。
68. 根據(jù)權(quán)利要求42-67中任一項所述的載體,其中所述5'UTR元件包含下述核酸序列 或由下述核酸序列組成:所述核酸序列與SEQ ID NOs. 1368或1452-1460的核酸序列,或與 相對應(yīng)的RNA序列具有至少約40 %,優(yōu)選至少約50 %,優(yōu)選至少約60 %,優(yōu)選至少約70 %, 更優(yōu)選至少約80 %,更優(yōu)選至少約90 %,甚至更優(yōu)選至少約95 %,甚至更優(yōu)選至少約99 % 的同一性,或者其中所述至少一個5'UTR元件包含下述或由下述組成:與SEQ ID NOs. 1368 或1452-1460的核酸序列,或與相對應(yīng)的RNA序列具有至少約40 %,優(yōu)選至少約50 %,優(yōu)選 至少約60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu)選至少約90%,甚至更優(yōu)選至少約 95%,甚至更優(yōu)選至少約99%的同一性的核酸序列的片段。
69. 根據(jù)權(quán)利要求62,64,66和68中任一項所述的載體,其中,所述片段由與全長序列 中的連續(xù)核苷酸片段相對應(yīng)的連續(xù)核苷酸片段組成,其表示所述片段所來源的全長序列的 至少20 %,優(yōu)選至少30 %,更優(yōu)選至少40 %,更優(yōu)選至少50 %,甚至更優(yōu)選至少60 %,甚至 更優(yōu)選至少70 %,甚至更優(yōu)選至少80 %,并且最優(yōu)選至少90 %。
70. 根據(jù)權(quán)利要求42-69中任一項所述的載體,其中所述至少一個5' UTR元件表現(xiàn)出 至少約20個核苷酸的長度,優(yōu)選至少約30個核苷酸的長度,更優(yōu)選至少約40個核苷酸的 長度。
71. 根據(jù)權(quán)利要求42-70中任一項所述的載體,其中所述5' UTR元件包含下述核酸序 列或由下述核酸序列組成:所述核酸序列來源于選自RPSA,RPS2, RPS3, RPS3A,RPS4, RPS5, RPS6, RPS7, RPS8, RPS9, RPS10, RPS11, RPS12, RPS13, RPS14, RPS15, RPS15A, RPS16, RPS17, RPS18, RPS19, RPS20, RPS21, RPS23, RPS24, RPS25, RPS26, RPS27, RPS27A, RPS28, RPS29, RPS30, RPL3, RPL4, RPL5, RPL6, RPL7, RPL7A, RPL8, RPL9, RPLlO, RPLl0A, RPLlI, RPLl2, RPL13, RPL13A, RPL14, RPL15, RPL17, RPL18, RPL18A, RPL19, RPL21, RPL22, RPL23, RPL23A, RPL24, RPL26, RPL27, RPL27A, RPL28, RPL29, RPL30, RPL31, RPL32, RPL34, RPL35, RPL35A, RPL36, RPL36A, RPL37, RPL37A, RPL38, RPL39, RPL40, RPL41, RPLPO, RPLPl, RPLP2, RPLP3, UBA52的TOP基因的5' UTR,或來源于其變體。
72. 根據(jù)權(quán)利要求43-71中任一項所述的載體,其中所述至少一個組蛋白莖環(huán)包含下 述核酸序列或由下述核酸序列組成:所述核酸序列選自由SEQ ID NOs. 1391-1433組成的 組,優(yōu)選選自由SEQ ID NOs. 1403-1433組成的組。
73. 根據(jù)權(quán)利要求43-72中任一項所述的載體,其中所述組蛋白莖環(huán)包含下述核酸序 列或由下述核酸序列組成:所述核酸序列與SEQ ID NO. 1433的序列或與相對應(yīng)的RNA序列 具有至少約75%,優(yōu)選至少約80%,優(yōu)選至少約85%,更優(yōu)選至少約90%,甚至更優(yōu)選至少 約95%的序列同一性,其中,優(yōu)選地,與SEQ ID NO. 1433的序列或與相對應(yīng)的RNA序列具 有至少約75%、優(yōu)選至少約80%、優(yōu)選至少約85%、更優(yōu)選至少約90%、甚至更優(yōu)選至少約 95%的序列同一性的所述序列的位置6、13和20是保守的,S卩,與SEQ ID NO. 1433或與相 對應(yīng)的RNA核苷酸的位置6、13和20的核苷酸相同。
74. 根據(jù)權(quán)利要求58-73中任一項所述的載體,其中所述3' UTR元件包含下述核酸序 列或由下述核酸序列組成:所述核酸序列來源于選自由下述組成的組的基因的3' UTR :白 蛋白基因,a-珠蛋白基因,¢-珠蛋白基因,酪氨酸羥化酶基因,脂加氧酶基因和膠原蛋白 a基因,或來源于選自由下述組成的組的基因的3'UTR的變體:白蛋白基因,a-珠蛋白基 因,珠蛋白基因,酪氨酸羥化酶基因,脂加氧酶基因和膠原蛋白a基因。
75. 根據(jù)權(quán)利要求58-74中任一項所述的載體,其中所述至少一個3' UTR元件包含下 述核酸序列或由下述核酸序列組成:所述核酸序列來源于脊椎動物白蛋白基因的3'UTR或 來源于其變體,優(yōu)選來源于哺乳動物白蛋白基因的3' UTR或來源于其變體,更優(yōu)選來源于 人白蛋白基因的3' UTR或來源于其變體,甚至更優(yōu)選來源于GenBank登記號NM_000477. 5 的人白蛋白基因的3' UTR或來源于其變體。
76. 根據(jù)權(quán)利要求58-74中任一項所述的載體,其中所述至少一個3'UTR元件包含下述 核酸序列或由下述核酸序列組成:所述核酸序列來源于脊椎動物a -珠蛋白基因的3' UTR 或來源于其變體,優(yōu)選來源于哺乳動物a-珠蛋白基因的3'UTR或來源于其變體,更優(yōu)選來 源于人a -珠蛋白基因的3'UTR或來源于其變體。
77. 根據(jù)權(quán)利要求58-74中任一項所述的載體,其中所述至少一個3'UTR元件包含下述 核酸序列或由下述核酸序列組成:所述核酸序列與選自SEQ ID NOs. 1369-1377和1434的 核酸序列或與相對應(yīng)的RNA序列具有至少約40 %,優(yōu)選至少約50 %,優(yōu)選至少約60 %,優(yōu)選 至少約70 %,更優(yōu)選至少約80 %,更優(yōu)選至少約90 %,甚至更優(yōu)選至少約95 %,甚至更優(yōu)選 至少約99%的同一性,或者,其中所述至少一種3'UTR元件包含下述或由下述組成:與選自 SEQ ID NOs. 1369-1377和1434的核酸序列或與相對應(yīng)的RNA序列具有至少約40%,優(yōu)選 至少約50%,優(yōu)選至少約60%,優(yōu)選至少約70%,更優(yōu)選至少約80%,更優(yōu)選至少約90%, 甚至更優(yōu)選至少約95%,甚至更優(yōu)選至少約99%的同一性的核酸序列的片段。
78. 根據(jù)權(quán)利要求77所述的載體,其中所述片段由與全長序列中的連續(xù)核苷酸片段 相對應(yīng)的連續(xù)核苷酸片段組成,其表示所述片段所來源的全長序列的至少20 %,優(yōu)選至少 30%,更優(yōu)選至少40%,更優(yōu)選至少50%,甚至更優(yōu)選至少60%,甚至更優(yōu)選至少70%,甚 至更優(yōu)選至少80 %,并且最優(yōu)選至少90 %。
79. 根據(jù)權(quán)利要求58-78中任一項所述的載體,其中所述3' UTR元件表現(xiàn)出至少約40 個核苷酸的長度,優(yōu)選至少約50個核苷酸的長度,優(yōu)選至少約75個核苷酸的長度,更優(yōu)選 至少約100個核苷酸的長度,甚至更優(yōu)選至少約125個核苷酸的長度,最優(yōu)選至少約150個 核苷酸的長度。
80. 根據(jù)權(quán)利要求42-79中任一項所述的載體,其中所述載體,優(yōu)選所述可讀框,是至 少部分G/C修飾的,優(yōu)選地,其中,與野生型可讀框相比,所述可讀框的G/C含量增加。
81. 根據(jù)權(quán)利要求42-80中任一項所述的載體,其中所述可讀框包含密碼子優(yōu)化的區(qū) 域,優(yōu)選地,其中所述可讀框是密碼子優(yōu)化的。
82. 根據(jù)權(quán)利要求42-81中任一項所述的載體,其是DNA載體。
83. 根據(jù)權(quán)利要求42-82中任一項所述的載體,其是質(zhì)粒載體或病毒載體,優(yōu)選是質(zhì)粒 載體。
84. 根據(jù)權(quán)利要求42-83中任一項所述的載體,其包含或編碼權(quán)利要求1-41中任一項 所述的人工核酸分子。
85. 根據(jù)權(quán)利要求42-84中任一項所述的載體,其是環(huán)形分子。
86. -種細胞,所述細胞包含權(quán)利要求1-41中任一項的人工核酸分子或權(quán)利要求 42-85中任一項的載體。
87. 根據(jù)權(quán)利要求86所述的細胞,其是哺乳動物細胞。
88. 根據(jù)權(quán)利要求86或87所述的細胞,其是哺乳動物受試者的細胞,優(yōu)選是哺乳動物 受試者的分離的細胞,優(yōu)選是人受試者的分離的細胞。
89. -種藥物組合物,其包含權(quán)利要求1-41中任一項的人工核酸分子,權(quán)利要求42-85 中任一項的載體,或權(quán)利要求86-88中任一項的細胞。
90. 根據(jù)權(quán)利要求89所述的藥物組合物,其還包含一種或多種藥用稀釋劑和/或賦形 劑和/或一種或多種佐劑。
91. 權(quán)利要求1-41中任一項的人工核酸分子、權(quán)利要求42-85中任一項的載體、權(quán)利要 求86-88中任一項的細胞或權(quán)利要求89或90的藥物組合物,其用作藥物。
92. 權(quán)利要求1-41中任一項的人工核酸分子、權(quán)利要求42-85中任一項的載體、權(quán)利要 求86-88中任一項的細胞或權(quán)利要求89或90的藥物組合物,其用作疫苗或用于基因治療。
93. -種用于治療或預(yù)防病癥的方法,所述方法包括給有此需要的受試者施用權(quán)利要 求1-41中任一項的人工核酸分子、權(quán)利要求42-85中任一項的載體、權(quán)利要求86-88中任 一項的細胞或權(quán)利要求89或90的藥物組合物。
94. 一種用于治療或預(yù)防病癥的方法,所述方法包括用權(quán)利要求1-41中任一項的人工 核酸分子或權(quán)利要求42-85中任一項的載體轉(zhuǎn)染細胞。
95. 根據(jù)權(quán)利要求94所述的方法,其中細胞的轉(zhuǎn)染在體外/離體進行,并且將所轉(zhuǎn)染的 細胞施用給有此需要的受試者,優(yōu)選施用給人患者。
96. 根據(jù)權(quán)利要求95所述的方法,其中要在體外轉(zhuǎn)染的細胞是所述受試者的分離的細 胞,優(yōu)選人患者的分離的細胞。
97. 根據(jù)權(quán)利要求93-96中任一項所述的方法,其是接種疫苗方法或基因治療方法。
98. -種用于增加來自人工核酸分子的蛋白生產(chǎn)的方法,所述方法包括向所述人工核 酸分子提供以下各項的步驟: i.至少一個5'-非翻譯區(qū)元件(5'UTR元件),其包含來源于TOP基因的5'UTR或來 源于TOP基因的5' UTR的變體的核酸序列或由來源于TOP基因的5' UTR或來源于TOP基 因的5' UTR的變體的核酸序列組成; ii. 優(yōu)選至少一個組蛋白莖環(huán);和 iii. 任選地,聚腺苷酸序列和/或聚腺苷酸化信號。 99. 5 ' UTR元件和優(yōu)選至少一個組蛋白莖環(huán)用于增加來自核酸分子的蛋白生產(chǎn)的應(yīng)用, 其中所述5' UTR元件包含下述核酸序列或由下述核酸序列組成:所述核酸序列來源于TOP 基因的5' UTR或來源于TOP基因的5' UTR的變體。
100. -種試劑盒或多部件的試劑盒,其包含權(quán)利要求1-41中任一項的人工核酸分子, 權(quán)利要求42-85中任一項的載體,權(quán)利要求86-88中任一項的細胞,和/或權(quán)利要求89或 90的藥物組合物。
101. 根據(jù)權(quán)利要求1〇〇所述的試劑盒,其還包含使用說明書,用于轉(zhuǎn)染的細胞,佐劑, 用于施用所述藥物組合物的裝置,藥用載體和/或用于溶解或稀釋所述人工核酸分子、所 述載體或所述藥物組合物的藥用溶液。
【文檔編號】C12N15/67GK104284979SQ201380016579
【公開日】2015年1月14日 申請日期:2013年3月27日 優(yōu)先權(quán)日:2012年3月27日
【發(fā)明者】安德烈亞斯·特斯 申請人:庫瑞瓦格有限責(zé)任公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1