專利名稱:使用由互補于靶mRNA的核苷酸序列組成的siRNA抑制靶mRNA表達的方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及使用小分子干擾RNA(以下稱為“siRNA”)抑制靶mRNA表達的方法,更具體而言,本發(fā)明涉及一種使用siRNA抑制靶mRNA表達的方法,該方法包含通過分析候選siRNA的核苷酸序列的相鄰和非相鄰部分之間的相對結(jié)合能模式,篩選預(yù)測的顯示最大靶向抑制效率的互補siRNA的步驟,以及使用篩選的siRNA抑制靶mRNA表達的步驟。
背景技術(shù):
RNA干擾(以下稱為“RNAi”)是指通過具有互補于靶mRNA的核苷酸序列的雙鏈RNA(以下稱為“dsRNA”)分解細胞質(zhì)中的靶mRNA的現(xiàn)象。1998年,F(xiàn)ire和Mello首次在線蟲(C.elegans)中發(fā)現(xiàn)RNA干擾現(xiàn)象后,在果蠅、錐蟲(鞭毛蟲綱的一種)和脊椎動物中也報道了RNAi現(xiàn)象的存在(Tabara H,Grishok A,Mello CC,Science,282(5388),430-1,1998)。對人類來說,由于將dsRNA導(dǎo)入時誘導(dǎo)抗病毒干擾素途徑,因而難以獲得RNAi作用。2001年,Elbashir和Tuschl等人報道了將21個核苷酸長度的小分子dsRNA導(dǎo)入人細胞沒有引起這種干擾素途徑,卻特異地分解互補的靶mRNA(Elbashir,S.M.,Harborth,J.,Lendeckel,W.,Yalcin,A.,Weber,K.,Tuschl,T.,Nature,411,494-498,2001;Elbashir,S.M.,Lendeckel,W.,Tuschl,T.,Genes&Dev.,15,188-200,2001;Elbashir,S.M.,Martinez,J.,Patkaniowska,A.,Lendeckel,W.,Tuschl,T.,EMBO J.,20,6877-6888,2001)。此后,21nt長度的dsRNA作為一種新的功能基因組學(xué)工具引起人們的注意,并被命名為小分子干擾RNA(以下稱為“siRNA”)。該小分子干擾RNA(siRNA和microRNA)被認為是Science期刊在2002年度的最大突破(Jennifer Couzin,BREAKTHROUGH OF THE YEARSmall RNAs Make Big Splash,JenniferCouzin,Science 20 December 20022296-2297)。
作為一種治療學(xué)和功能基因組學(xué)的工具,siRNA比傳統(tǒng)的反義RNA具有一些優(yōu)勢。首先,反義RNA需要合成許多種類的反義RNA,需要投入大量的時間和費用進行實驗以獲得有效的靶序列,而siRNA的效果可以通過一些算法進行預(yù)測,從而通過較少量的實驗篩選更有效的siRNA。第二,與反義RNA相比,已知siRNA可在更低濃度有效抑制基因的表達。這意味著可使用較少量的siRNA進行研究并且有望獲得更好的治療效果。第三,通過RNAi的基因表達抑制是體內(nèi)的自然機制,其作用非常特異。
通常,RNAi實驗包括siRNA設(shè)計(靶點篩選)、細胞培養(yǎng)實驗(細胞培養(yǎng)試驗、靶mRNA降解速率、最有效siRNA的篩選)、動物實驗(穩(wěn)定性、修飾、輸送、藥代動力學(xué)、毒理學(xué))和臨床測試。這些實驗中,最重要的步驟是篩選有效的siRNA序列,以及將篩選的siRNA輸送到靶組織(藥物輸送)。篩選高效率的siRNA序列很重要,因為不同的siRNA顯示不同的效率,而只有高效的siRNA才會帶來準確的實驗結(jié)果,并能用于治療。通過計算機輔助評分法和實驗方法篩選有效的核苷酸序列。所述實驗方法的目的在于篩選與體外轉(zhuǎn)錄合成的靶mRNA具有良好結(jié)合的核苷酸序列。然而,由體外轉(zhuǎn)錄獲得的mRNA結(jié)構(gòu)可能不同于細胞中mRNA的結(jié)構(gòu),并且很多蛋白質(zhì)可結(jié)合于細胞中的mRNA,從而使得利用體外轉(zhuǎn)錄的mRNA獲得的實驗結(jié)果不能反映真實的結(jié)果。因此,開發(fā)一種篩選有效siRNA序列的算法很重要,其可以通過考慮影響siRNA序列有效性的各種要素實現(xiàn)。
通常,按照Tuschl規(guī)則進行傳統(tǒng)的siRNA設(shè)計,其考慮到3′突出端的類型、GC比值、特異核苷酸的重復(fù)、序列中的SNP(單核苷酸多態(tài)性)、RNA的二級結(jié)構(gòu)、與非靶mRNA序列的同源性(S.M.Elbashir,J.Harborth,W.Lendeckel,A.Yalcin,Klaus Weber,T.Tuschl,Nature,411,494-498,2001a;S.M.Elbashir,W.Lendeckel,T.Tuschl,Genes&Dev.,15,188-200,2001b;S.M.Elbashir,J.Martinez,A.Patkaniowska,W.Lendeckel,T.Tuschl,EMBO J.,20,6877-6888,2001c)。然而,最近在siRNA設(shè)計中,考慮siRNA雙鏈部分的結(jié)合能態(tài)(Khvorova,A.,Reynolds,A.,Jayasena,S.D.,Cell,115(4),505,2003;Reynolds,A.,Leake,D.,Boese,Q.,Scaringe,S.,Marshall,W.S.,Khvorova,A.,Nat.Biotechnol.,22(3),326-330,2004)。例如,考慮到雙鏈siRNA中與RISC(RNAi誘導(dǎo)的沉默復(fù)合體(silencing complex))結(jié)合的鏈可決定性地影響siRNA的效率,通過計算候選siRNA的5′端和3′端之間的能量差可預(yù)測siRNA的效率(Schwarz DS,Hutvagner G,Du T,Xu Z,Aronin N,Zamore PD.,Cell,115(2),199-208,2003,參見圖1)。
使用統(tǒng)計學(xué)方法,本發(fā)明者更準確和精確地研究了siRNA效率和siRNA整個雙鏈部分結(jié)合能態(tài)之間的關(guān)系。迄今,僅僅報道了siRNA的局部部分的上述關(guān)系。結(jié)果我們發(fā)現(xiàn)通過對候選siRNA相對結(jié)合能模式進行分析,可預(yù)測候選siRNA對靶mRNA的抑制效率,并且利用篩選的siRNA可有效抑制靶mRNA的表達。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種使用siRNA有效抑制靶mRNA表達的方法,其中通過分析候選siRNA的相對結(jié)合能模式而無需進行任何實驗篩選所述siRNA。
根據(jù)本發(fā)明的一個實施方式,使用siRNA抑制靶mRNA表達的方法,包括 (1)獲得dsRNA序列的所有組合,其中每個RNA序列都由n個與預(yù)定靶mRNA互補的核苷酸(n為整數(shù))組成; (2)獲得每個dsRNA的EA、EB、EC和ED,其為所述dsRNA堿基序列中的第1-2位結(jié)合能位置構(gòu)成的段(A)、第3-7位結(jié)合能位置構(gòu)成的段(B)、第8-15位結(jié)合能位置構(gòu)成的段(C)和第16-18位結(jié)合能位置構(gòu)成的段(D)的平均結(jié)合能數(shù)值; (3)根據(jù)下列方程,對于dsRNA序列的每種組合,將Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)分配到(A)至(D)的各段, 對于(A-B)段 i)如果 那么Y(A-B)=10分, ii)如果 那么Y(A-B)=0分, iii)如果X(A-B)不屬于所述范圍,則Y(A-B)=5分, 同樣,將Y(B-C)、Y(C-D)和Y(A-D)分配到(B-C)段、(C-D)段和(A-D)段, 其中Ei(A-B)是每個(A-B)段平均能量值差異的平均值, Si(A-B)是Ei(A-B)的分布值, Ni是siRNA的實驗數(shù)據(jù)的數(shù)目, X(A-B)是對應(yīng)于與(A)段平均結(jié)合能EA和(B)段平均結(jié)合能EB之間的差值,同樣適用于Y(B-C)、Y(C-D)和Y(A-D); (4)根據(jù)下述方程4,分配每個dsRNA的相對結(jié)合能Y值 [方程4] 其中W(A-B)是(A-B)段的加權(quán); (5)通過下述方程5,分配每個dsRNA的Z值 [方程5] 其中i為整數(shù),代表影響siRNA對靶mRNA抑制效率的因子,其中至少有一個是siRNA的相對結(jié)合能, Zi是給予每個因子的分值,假設(shè)Z1=Y(jié),代表步驟(4)的相對結(jié)合能, Mi是分配給每個因子的預(yù)定最大值,和 Wi是基于W1分配給每個因子的預(yù)定加權(quán); (6)將在步驟(5)獲得的每個dsRNA的Z值降序排列,從而篩選dsRNA的預(yù)定前%;以及 (7)應(yīng)用篩選的dsRNA抑制靶mRNA表達。
所述siRNA是包含21-23個、優(yōu)選為21個核苷酸的dsRNA,并具有由19個核苷酸組成的雙鏈中心區(qū)域結(jié)構(gòu),以及在該雙鏈中心區(qū)域的兩個3′端突出1-3個核苷酸、優(yōu)選突出2個核苷酸(參見圖3)。
通過分析抑制靶mRNA表達的候選siRNA的相對結(jié)合能模式以優(yōu)化用于靶mRNA的siRNA設(shè)計,本發(fā)明者依據(jù)siRNA的雙鏈區(qū)域的相對結(jié)合能模式對siRNA進行評分和分類。
為了獲知某種siRNA對靶mRNA的抑制效率,本發(fā)明者研究了siRNA的結(jié)合能態(tài)和抑制效率之間的相關(guān)性。本發(fā)明者并沒有關(guān)注雙鏈siRNA特定區(qū)域的絕對結(jié)合能值,而是關(guān)注siRNA的相鄰和非相鄰部分之間的相對結(jié)合能變化(參見圖2)。
根據(jù)本發(fā)明的一個實施方式,使用siRNA的基因表達抑制數(shù)據(jù)采集自兩篇論文。一篇是Khvorova的論文(Khvorova A,Reynolds A,JayasenaSD,Cell,115(4),505,2003),另一篇是Amarzguioui的論文(AmarzguiouiM,Prydz H,Biochem.Biophys.Res.Commun.,316(4),1050-8,2004)。Khvorova的論文公開了由SEQ.ID.NO1表示的核苷酸序列,其對應(yīng)于人親環(huán)蛋白基因(hCyPB)的第193-390位核苷酸序列,由SEQ.ID.NO2表示的核苷酸序列,其對應(yīng)于螢火蟲熒光素酶基因((pGL3)的第1434-1631位核苷酸序列,以及抑制這些基因的siRNA。Amarzguioui的論文公開了用于抑制不同基因(AA)的siRNA。從采集到的數(shù)據(jù)中,獲得用于數(shù)據(jù)分析的siRNA堿基序列和所述siRNA的基因表達抑制作用。
表1顯示從Khvorova的論文中獲得的部分實驗數(shù)據(jù)。INN-HB最近鄰模型使得堿基序列信息轉(zhuǎn)化為結(jié)合能的數(shù)據(jù)(Xia T,SantaLucia J Jr,BurkardME,Kierzek R,Schroeder SJ,Jiao X,Cox C,Turner DH,Biochemistry,37(42),14719-35,1998,參見圖3和圖4)。
表1 *代表在SEQ ID NO1中,從指定位置到第21位核苷酸所記載的堿基序列。
根據(jù)圖3,所述siRNA包括l8個結(jié)合能模式。從步驟(a)中獲得的具有特異堿基序列的siRNA的18個結(jié)合能模式與基因表達抑制率之間的相互關(guān)系取決于上述18個結(jié)合能模式如何被劃分為段,從而控制結(jié)合能的整體模式。結(jié)果,在從(a)獲得的140個siRNA抑制基因表達的實驗數(shù)據(jù)集中,本發(fā)明者計算了第1-18位置的每個結(jié)合能模式的平均值,然后給出x軸為第1-18位置、y軸為結(jié)合能(-ΔG)的圖,如圖5所示。
本發(fā)明者設(shè)定段使具有如下現(xiàn)象某段和其相鄰段之間的平均結(jié)合能差異在有效siRNA(超過90%的基因抑制)和無效siRNA(低于50%的基因抑制)之間發(fā)生最大程度地逆轉(zhuǎn)。即將18個結(jié)合能位置劃分為很多段,優(yōu)選劃分為A、B、C和D四段,每段的平均能量定義為EA、EB、Ec和ED,并設(shè)定這些段使有效siRNA和無效siRNA的各段中平均結(jié)合能差(即EA-EB、EB-Ec、Ec-ED)最大程度地遠離0以顯示最大變化。
為此,將siRNA基因表達抑制的實驗數(shù)據(jù)分成有效組和無效組。通過t-檢測,證實了該兩組在第1-18結(jié)合能位置上沒有差異的無效假說。即,在該兩組中,p-值小于O.05的結(jié)合能位置,其結(jié)合能具有接近5%顯著水平的差異。圖6表示表示x軸為結(jié)合能位置、y軸為p-值的結(jié)果圖,圖7是x軸為結(jié)合能位置、y軸為通過下列方程l得到的t-值的平滑曲線圖。
[方程1]
此處,
有效組的平均結(jié)合能;
無效組的平均結(jié)合能; Sx有效組的分布; Sy無效組的分布; Nx有效組的變化數(shù)(the number of variation); Ny無效組的變化數(shù)。
本發(fā)明的優(yōu)選實施方式中使用了三個數(shù)據(jù)集。來自Khvorova的論文的兩個數(shù)據(jù)集包括對pGL3和hCyPB的基因抑制實驗結(jié)果,這些實驗結(jié)果被劃分為有效組(超過90%的抑制)和無效組(低于50%的抑制)。來自Amarzguioui的論文的一個數(shù)據(jù)集包括對各種基因(AA)的實驗結(jié)果,這些實驗結(jié)果被一并劃分為有效組(超過70%的抑制)和無效組(低于70%的抑制)。Khvorova的論文包括對螢火蟲熒光素酶基因(pGL3)的40個有效的結(jié)果和20個無效的結(jié)果,以及對人親環(huán)蛋白(hCyPB)的13個有效的結(jié)果和21個無效的結(jié)果。Amarzguioui的論文包括對各種基因(AA)的21個有效的結(jié)果和25個無效的結(jié)果。
本發(fā)明者注意到所顯示的三個數(shù)據(jù)集的t-值變化類型是如圖7所示的相同模式。與其余數(shù)據(jù)集中的劃分相比,預(yù)計在Amarzguioui論文的數(shù)據(jù)集中,有效組和無效組的劃分更不明確,這表明比其余數(shù)據(jù)集相比,Amarzguioui論文的數(shù)據(jù)集具有更小的t-值變化幅度。這意味著在有效siRNA和無效siRNA之間,具有特定的結(jié)合能模式劃分。
當(dāng)有效siRNA組和無效siRNA組之間的結(jié)合能差異非常大時,t-值具有最大值或最小值,或者p-值變?yōu)榻咏?。即如果以某部分為中心的鄰近區(qū)域設(shè)定為段時,鄰近區(qū)域之間的結(jié)合能偏差可被最大化。如果即使t-值具有最大值或最小值,但當(dāng)t-值的最大值和最小值的偏差并不大時,即認為p-值不具有差別,因此可不將它們指定為段。
在本發(fā)明的優(yōu)選實施方式中,利用圖6的p-值指定所述段的中心位置。此處運用下列標準 ①當(dāng)Khovorova兩個數(shù)據(jù)集中的一個或多個的p-值為0.1或更??; ②當(dāng)Khovorova兩個數(shù)據(jù)集中的所有為0.4或更小。
適合標準①和②的位置包括第1結(jié)合能位置、第5-6結(jié)合能位置、第14結(jié)合能位置和第17-18結(jié)合能位置。
下文中,只使用Khvorova的兩個數(shù)據(jù)集,因為Amarzguioui數(shù)據(jù)集的組劃分標準不同于Khvorova的兩個數(shù)據(jù)集的組劃分標準,并且根據(jù)本發(fā)明,在建立用于評價siRNA效率的方法之后,再驗證其性能。
隨后,以上面四個位置作為中心確定段。確定段的基礎(chǔ)在于使確定段的平均結(jié)合能與其他鄰近段的結(jié)合能之間的差異變化最大化。優(yōu)選地,隨后的步驟可分為以下兩種情況 (1)鄰近段之間沒有任何空置區(qū)域,連續(xù)實施該步驟的情況; (2)鄰近段之間存在空置區(qū)域,斷續(xù)實施該步驟的情況。
上述兩種情況各有優(yōu)缺點。盡管情況(1)可對所有的結(jié)合能狀態(tài)進行研究,但由于部分段不能區(qū)分而使預(yù)測能力降低。另一方面,盡管情況(2)排除了不能區(qū)分的段而使預(yù)測值最大化,但其不能對位置進行評價。
優(yōu)選地,將(1)段設(shè)定為如下 (a)段分為A、B、C和D四段,包括分別基于標準①和②的四個位置集,也包括不侵占其他位置區(qū)域的所有結(jié)合能位置,從而獲得如表2所示的20種組合。
表2 此處,有效siRNA的數(shù)目為Nf,無效siRNA的數(shù)目為Nn,效率為i(‘f’表示有效組的siRNA的情況,‘n’表示無效組的siRNA的情況)。將第j個(其值為1-Nf或1-Nn中的數(shù)值)siRNA在k段(A、B、C和D其中之一)具有的每一結(jié)合能位置的平均結(jié)合能定義為Eijk。例如在有效組的第三siRNA的B段中,用Ef3B代表每一結(jié)合能位置的平均結(jié)合能。利用實驗數(shù)據(jù)獲得每個Eijk。
按照下列方程2,利用每個Eijk獲得平均結(jié)合能變化,其成為A-B段(Ei(A-B)),B-C段(Ei(B-C)),C-D段(Ei(C-D))的代表。
[方程2] 可利用方程2得到Ei(B-C)和Ei(C-D)。此處,Ef(A-B)為一個數(shù)值,其代表有效組siRNA的A段和B段中,每一結(jié)合能位置的結(jié)合能,En(A-B)是代表無效組的數(shù)值。即如果篩選一個段以增加Ef(A-B)-En(A-B)的絕對值,那么在A段和B段中,有效siRNA組和無效siRNA組之間的平均結(jié)合能差異變大。結(jié)果就可以利用上述特點篩選段。同樣也適用于B-C和C-D。本發(fā)明者僅篩選了在Ef(A-B)-En(A-B)、Ef(B-C)-En(B-C)和Ef(C-D)-En(C-D)中具有0.1或更大絕對值的段的組合。在本發(fā)明的優(yōu)選實施方式中,篩選了四個段,表3顯示了所篩選段的信息。
表3 在所篩選的四個段中,對Ef(A-B)和En(A-B)、Ef(B-C)和En(B-C)、Ef(C-D)和En(C-D)進行t-檢測,得到t-值和p-值。通過這種方法,在基因hCyPB和pGL3的p-值<0.05和t-值>2的所有段中,確定用于區(qū)分有效siRNA組和無效siRNA組的段。這些段是A(1-2)、B(3-7)、C(8-15)和D(16-18),圖8顯示了這些段的信息。
優(yōu)選地,將(2)段設(shè)定為如下 由于允許段斷續(xù)并且互相重疊,因此除了使用不同的方法設(shè)定段寬度,基本上重復(fù)與段(1)相同的方法。表4顯示了包括基于標準①和②設(shè)定的4個結(jié)合能位置在內(nèi)的2個結(jié)合能位置的所有段的組合。
表4 選擇表4中的A段、B段、C段和D段的其中之一,并進行必要段的組合。結(jié)果可能出現(xiàn)729(=3×9×9×3)種組合。由于幾乎不可能通過方程2的方法和t-檢測在729種組合中僅僅篩選出一個段的一個組合,因此優(yōu)選引入新的變量R(穩(wěn)健性的縮寫)。R表示除根據(jù)標準①和②設(shè)定的4個結(jié)合能位置外,位于該段中的結(jié)合能位置的數(shù)目。例如,如果設(shè)定A段是1-2、B段是4-7,那么A段的R值為1、B段的R值為2。當(dāng)考慮到該兩段的R值,比如A段(1-2)和B段(4-7)的(1)Ef(A-B),就將該兩段的R值相加,使得A-B段的R值設(shè)定為3。
從表4所示的A、B、C和D段的所有組合中分別獲得(1)中提到的Eijk。由方程2計算表4的所有組合的Ei(A-B)、Ei(B-C)和Ei(C-D)值,并且進行t-檢測,分別得到t-值和p-值。此處應(yīng)用上述R值。圖9顯示在具有特定R值的A-B段、B-C段和C-D段的所有組合中,p-值小于0.05的組合的比例圖。隨著R值變大,則p-值趨于變小。結(jié)果,在p-值急劇變小之前,計算R值以獲得包含期望p-值的最大范圍的段。根據(jù)圖9,當(dāng)R值為3或4或更小時,p-值<0.05的段的比例顯示為更高。因此,在本發(fā)明的優(yōu)選實施方案中,適宜的段僅包括具有R=3或4的段。
由R值和t-檢測結(jié)果確定最終的段。由于要求兩段的R值為3或4,在B段和C段中加入兩個結(jié)合能位置,其中在兩端都加入段;在A段和D段中,加入一個結(jié)合能位置,其中在一端加入段。結(jié)果,A-B中R=3,B-C中R=4和C-D中R=3。當(dāng)?shù)玫剿蟹显摋l件的段組合后,對這些組合進行t-檢測從而篩選具有極低p-值的一個段組合。篩選出的段是A(1-2)、B(3-6)、C(14-16)和D(16-18)。表5顯示這些段的信息。
表5 表6 在本發(fā)明的優(yōu)選實施方式中,通過區(qū)別鄰近段的相對結(jié)合能模式,篩選由(1)和(2)設(shè)定的段(參見圖10)。然而,由于在非鄰近段之間的結(jié)合能存在足夠的差異,對由A、B、C、D四段的差異獲得A-B、B-C、C-D、A-C、A-D和B-D的六種組合進行t-檢測。表6顯示t-檢測結(jié)果。
如表6所示,在A-C段和B-D段之間沒有大的差異。A-D組合符合非鄰近段的p-值<0.05的條件。此處,通過其它實驗結(jié)果,已知A段5′端和B段3′端之間的結(jié)合能差異影響siRNA的效率(Schwarz,D.S.,Hutvagner,G,Du,T.,Xu,Z.,A ronin,N.,Zamore,P.D.,Cell,115(2),199-20,2003)。
本發(fā)明者利用采集的實驗數(shù)據(jù)和篩選的段計算未知siRNA的相對結(jié)合能。為了建立一個評分系統(tǒng),將來自Khvorova論文的兩個數(shù)據(jù)集,即螢火蟲熒光素酶(pGL3)和人親環(huán)蛋白(hCyPB)的實驗結(jié)果包括在采集的數(shù)據(jù)中從而獲得更大的數(shù)據(jù)集。在用于建立評分系統(tǒng)的數(shù)據(jù)中,排除通過基于70%的基因表達抑制率進行劃分而獲得的、來自Amarzguioui論文的一個數(shù)據(jù)集,因為它的劃分標準不同于Khvorova論文中的數(shù)據(jù)分類標準,后者認為90%或更高為有效,而50%或更少為無效。將獲得的數(shù)據(jù)分為有效組(90%或更高的基因表達抑制率功能的或f)和無效組(50%或更低的基因表達抑制率非功能的或n)。
將獲得的數(shù)據(jù)劃分到上述方法得到的段中,從而由方程2得到Ei(A-B)、Ei(B-C)、Ei(C-D)和Ei(A-D)。這些是通過對平均能量差異值進行平均化而獲得的平均能量值。在該方法中,每個值都具有分布值,即Si(A-B)、Si(B-C)、Si(C-D)和Si(A-D)。將siRNA實驗數(shù)據(jù)的數(shù)目定義為Ni。表7顯不Ei(A-B)、Ei(B-C)、Ei(C-D)、Ei(A-D)值、Si(A-B)、Si(B-C)、Si(C-D)、Si(A-D)、Ni值,以及t-檢測的t-值和p-值。
如表7所示,由于數(shù)據(jù)集中所有段的p-值<0.05,其可用于劃分有效siRNA和無效siRNA的評分系統(tǒng)中。
如果在有效siRNA組中,特定siRNA的A段和B段之間的平均結(jié)合能差異為Xf(A-B),根據(jù)方程3,X在p-值<0.05的顯著水平內(nèi)變化。
[方程3] 表7 方程3能用于所有的Xi(A-B)、Xi(B-C)、Xi(C-D)和Xi(A-D),也能獲得如圖11所示的Xi(A-B)、Xi(B-C)、Xi(C-D)和Xi(A-D)的每個范圍。
通過相對結(jié)合能模式,考慮如下結(jié)果,對未知siRNA的效率進行評分 (1)獲得平均結(jié)合能值,即得到未知siRNA的A-B、B-C、C-D和A-D段的X(A-B)、X(B-C)、X(C-D)和X(A-D); (2)確定X(A-B)所屬范圍并且按以下給予分值 i)如果 則給10分; ii)如果 則給0分; iii)當(dāng)所述范圍不屬于i)或ii),給5分。
以同樣的方法對X(B-C)、X(C-D)和X(A-D)給予分值。
每個分值定義為Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)。
參考圖11,對于連續(xù)段,如果-0.02<X(A-B)<0.38、-0.29<X(B-C)<-0.01、0.00<X(C-D)<0.35、0.07<X(A-D)<0.37,那么分別給予Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)10分。如果-0.63<X(A-B)<-0.21、0.05<X(B-C)<0.44、-0.47<X(C-D)<-0.09、-0.67<X(A-D)<-0.23,那么分別給予Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)0分。當(dāng)X(A-B)、X(B-C)、X(C-D)和X(A-D)不屬于所述范圍時,分別給予Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)5分。
對于斷續(xù)段,如果0.00<X(A-B)<0.40、-0.41<X(B-C)<-0.01、0.07<X(C-D)<0.39、0.07<X(A-D)<0.37,那么分別給予Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)10分。如果-0.63<X(A-B)<-0.21、0.10<X(B-C)<0.51、-0.47<X(C-D)<-0.19、-0.67<X(A-D)<-0.23,那么分別給予Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)0分。當(dāng)X(A-B)、X(B-C)、X(C-D)和X(A-D)不屬于所述范圍時,分別給予Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)5分。
3)當(dāng)Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)的加權(quán)因子定義為W(A-B)、W(B-C)、W(C-D)和W(A-D)時,利用方程4,基于滿分100,將相對結(jié)合能模式的Y分值進行轉(zhuǎn)化 [方程4] 根據(jù)如何設(shè)定各個段中的加權(quán)因子W(A-B)、W(B-C)、W(C-D)和W(A-D),對siRNA的結(jié)合能模式進行評分。為了優(yōu)化加權(quán)因子的組合,使加權(quán)因子以0.01的遞增從0增加到1,考察有效siRNA組和無效siRNA組之間的t-值。圖12顯示按照降序排列的前100個t-值中,依據(jù)每個加權(quán)因子值的組合的分布。參考圖12的分布,可以獲得使t-值最大化的位置,即獲得使有效siRNA組和無效siRNA組之間的結(jié)合能變化差異最大化的位置。用于使上述兩組之間t-值最大化的W(A-B)、W(B-C)、W(C-D)和W(A-D)組合在連續(xù)段為0.90-1.00、0.2-0.4、0.2-0.3和0.7-0.9,優(yōu)選1.00、0.37、0.20、0.90,以及在斷續(xù)段為0.5-0.7、0.3-0.5、0.3-0.5和0.9-1.0,優(yōu)選0.65、0.48、0.48和0.90。如果每種情況中將其設(shè)定在閾值之外,該評分方法中,t-值會快速下降甚至降到用于區(qū)分的不顯著水平。
最后,本發(fā)明者考慮到如何將相對結(jié)合能模式與其它因子(GC含量、Tm、結(jié)合能的絕對分值、與其它mRNA的同源性、RNA的二級結(jié)構(gòu))相結(jié)合以獲得預(yù)測siRNA總效率的系統(tǒng)。使用下列線性方程作為評分方法,其以基本同樣的方式對相對結(jié)合能模式進行評分。
如果將每個因子的分值定義為Zi(Z1、Z2、Z3、...、Zn),每個因子的滿分定義為Mi(M1、M2、M3、...、Mn),以及將每個因子的效率,即每一分值的加權(quán)因子定義為Wi(W1、W2、W3、...、Wn),那么根據(jù)方程5,代表siRNA效率的分值Z可基于滿分100分而表示 [方程5] 其中i是從1到n的整數(shù),包含許多影響靶mRNA的抑制作用的因子的Zi,包括作為必需因子的相對結(jié)合能、以及選自3′端5個堿基中的A/U數(shù)、第1位置G/C的存在、第19位置A/U的存在、G/C含量、Tm、RNA的二級結(jié)構(gòu)、與其它mRNA的同源性等的一個或多個因子作為任選因子。這些任選因子并不必然包括在Z值分配中,但是可以不加限制地包括那些與相對結(jié)合能一起更好地進行預(yù)測的因子。對因子的結(jié)合也沒有特殊的限制。在本發(fā)明的優(yōu)選實施方案中,選擇下列因子作為ZiZ1-相對結(jié)合能分值(Y),Z2-3′端5個堿基中的A/U數(shù),Z3-第1位置G/C的存在,Z4-第19位置A/U的存在,Z5-G/C含量的分值。各自的Mi值如下M1=100,M2=5,M3=1,M4=1,M5=10。
在本發(fā)明的優(yōu)選實施方案中,Z1為計算出的Y值,Z2為3′端5個堿基中的A/U數(shù),Z3為當(dāng)5′端堿基為G/C時是1,否則是0,Z4為當(dāng)3′端堿基為A/U是1,否則是0,以及Z5為當(dāng)G/C含量范圍為36-53%時是10,不屬于此范圍時是0。
與圖12對相對結(jié)合能進行評分的方式相同,圖13為對每個分值優(yōu)化加權(quán)因子Wi的圖。通過該方法優(yōu)化的W1、W2、W3、W4和W5的結(jié)合的范圍為0.9-1.0、0.0-0.2、0.1-0.3、0.0-0.4和0.0-0.2,優(yōu)選為0.90、0.07、0.15、0.19和0.11。
通過上述方法得到的Z值可作為區(qū)別未知siRNA具有何種相對結(jié)合能模式的指標。結(jié)果只有分析堿基序列可以評價結(jié)合能,從而使siRNA的設(shè)計和制備效率最大化。
根據(jù)本發(fā)明,可以預(yù)測未知siRNA對靶mRNA的抑制效率。結(jié)果通過使用上述方法篩選的具有優(yōu)異抑制效率的siRNA可有效抑制靶mRNA的表達,優(yōu)選使用篩選的對靶mRNA的Z值在前10%以內(nèi)的siRNA。上述數(shù)值可以是任何值,其可按照候選siRNA組的樣本大小、實驗條件等靈活選擇。
圖1表示siRNA基因表達抑制效率隨RISC酶結(jié)合模式的變化圖。
圖2表示基因表達抑制效率和siRNA結(jié)合能之間相互關(guān)系的評分方法的圖。
圖3表示在INN-HB最近鄰模型中,siRNA結(jié)合能的分布圖。
圖4表示在INN-HB最近鄰模型中的結(jié)合能值。
圖5表示在采集的siRNA數(shù)據(jù)的每個位置的結(jié)合能的平均值圖 X軸第1-18位置, Y軸結(jié)合能的平均值(-ΔG), 實線當(dāng)基因表達抑制率為90%或更高時, 點線當(dāng)基因表達抑制率低于50%時。
圖6表示在采集的siRNA數(shù)據(jù)的每個位置的結(jié)合能的t-檢測結(jié)果圖 X軸第1-18位置, Y軸p-值, 實線pGL3基因, 點線hCyPB基因 點劃線Amarzguioui論文中的復(fù)合基因。
圖7表示在采集的siRNA數(shù)據(jù)的每個位置的結(jié)合能的t-檢測結(jié)果圖 X軸第1-18位置, Y軸t-值, 實線pGL3基因, 點線hCyPB基因 點劃線Amarzguioui論文中的復(fù)合基因。
圖8表示通過方法(1)分析結(jié)合能數(shù)據(jù)得到關(guān)于A(1-2)段、B(3-7)段、C(8-15)段和D(16-18)段的各種信息的圖。
圖9表示在具有特定R值的A-B、B-C和C-D的組合中,p-值<0.05的比例的分布圖。
圖10表示通過方法(1)和方法(2)篩選的段的圖。
圖11表示圖(A)顯示通過方法(1)篩選出的A-B段、B-C段、C-D段和A-D段中,無效siRNA和有效siRNA平均結(jié)合能之間的相對差異的可靠段;以及圖(B)顯示通過方法(2)篩選出的A-B段、B-C段、C-D段和A-D段中,有效siRNA和無效siRNA平均結(jié)合能之間的相對差異的可靠段。
圖12表示相對結(jié)合能模式的評分中,加權(quán)因子和t-值之間的關(guān)系,其中將加權(quán)因子的組合按照t-值降序排列,從而顯示每段中前100個組合的加權(quán)因子數(shù)。此處,A是連續(xù)段中加權(quán)因子的分布,B是斷續(xù)段中加權(quán)因子的分布。
圖13表示與圖12對相對結(jié)合能進行評分的方式相同,對每個分值優(yōu)化加權(quán)因子Wi的圖。
具體實施例方式 本發(fā)明將參考以下實施例進行詳細描述,但本發(fā)明并不限于此。
實施例1與傳統(tǒng)siRNA設(shè)計方法的比較 為了檢測本發(fā)明使用相對結(jié)合能模式優(yōu)化siRNA設(shè)計方法的性能,將siRNA設(shè)計優(yōu)化方法與專利號WO2004/045543(Functional andHyperfunctional siRNA,2004年6月3日公開)公開的siRNA設(shè)計評分方法進行比較。專利號WO2004/045543的許多算法中所公開的siRNA效率評分方法根據(jù)下列方程6進行 [方程6] siRNA的相對函數(shù)性=-(GC/3)+(AU15-19)-(Tm20℃)*3-(G13)*3-(C19)+(A19)*2+(A3)+(U10)+(A13)-(U5)-(A11) 來自Khvorova和Amarzguioui的論文的三個數(shù)據(jù)集中,將Amarzguioui論文中的一個數(shù)據(jù)集,而不是Khvorova論文中用于評價相對結(jié)合能模式的的兩個數(shù)據(jù)集用作試驗數(shù)據(jù),從而比較這兩種評分方法的預(yù)測能力。首先,使用兩種方法計算包括在有效組/無效組中的siRNA的每個分值。通過LDA(線性判別分析)和QDA(二次方程判別分析),計算確定任意siRNA是有效還是無效。優(yōu)選地,可利用統(tǒng)計程序R得到上述值(http://www.R-project.org)([1]Richard A.Becker,John M.Chambers,and Allan R.Wilks.The New S Language.Chapman&Hall,London,1988;[2]John M.Chambers and Trevor J.Hastie.StatisticalModels in S.Chapman&Hall,London,1992;[3]John M.Chambers.Programming with Data.Springer,New York,1998.ISBN 0-387-98503-4;[4]William N.Venables and Brian D.Ripley.Modern Applied Statistics with S.Fourth Edition.Springer,2002.ISBN 0-387-95457-0;[5]William N.Venables and Brian D.Ripley.S Programming.Springer,2000.ISBN0-387-98966-8;[6]Deborah Nolan and Terry Speed.Stat LabsMathematicalStatistics Through Applications.Springer Texts in Statistics.Springer,2000.ISBN 0-387-98974-9;[7]Jose C.Pinheiro and Douglas M.Bates.Mixed-Effects Models in S and S-Plus.Springer,2000.ISBN 0-387-98957-0;[8]Frank E.Harrell.Regression Modeling Strategies,with Applications to Linear Models,Survival Analysis and Logistic Regression.Springer,2001.ISBN 0-387-95232-2;[9]Manuel Cast eion Limas,Joaquin Ordieres Mere,F(xiàn)co.Javier de Cos Juez,and Fco.Javier Martinez de Pison Ascacibar.Control de Calidad.Metodologia para el analisis previo a la modelizacion dedatos en procesos industrials.Furndamentos teoricos y aplicaciones con R.Servicio de Publicaciones de la Universidad de la Rioja,2001.ISBN84-95301-48-2;[10]John Fox.An R and S-Plus Companion to AppliedRegression.Sage Publications,Thousand Oaks,CA,USA,2002.ISBN0761922792;[11]Peter Dalgaard.Introductory Statistics with R.Springer,2002.ISBN 0-387-95475-9;[12]Stefano Iacus and Guido Masarotto.Laboratorio di statistica con R.McGraw-Hill,Milano,2003.ISBN88-386-6084-0;[13]John Maindonald and John Braun.Data Analysis andGraphics Using R.Cambridge University Press,Cambridge,2003.ISBN0-521-81336-0;[14]Giovanni Parmigiani,Elizabeth S.Garrett,Rafael A.Irizarry,and Scott L.Zeger.The Analysis of Gene Expression Data.Springer,New York,2003.ISBN 0-387-95577-1;[15]Sylvie Huet,Annie Bouvier,Marie-Anne Gruet,and Emmanuel Jolivet.Statistical Tools for NonlinearRegression.Springer,New York,2003.ISBN 0-387-40081-8;[16]S.Mase,T.Kamakura,M.Jimbo,and K.Kanefuji.Introduction to Data Science forengineers-Data analysis using free statistical software R(in Japanese).Suuri-Kogaku-sha,Tokyo,April 2004.ISBN 4901683128;[17]Julian J.Faraway.Linear Models with R.Chapman&Hall/CRC,Boca Raton,F(xiàn)L,2004.ISBN 1-584-88425-8;[18]Richard M.Heiberger and Burt Holland.Statistical Analysis and Data DisplayAn Intermediate Course withExamples in S-Plus,R,and SAS.Springer Texts in Statistics.Springer,2004.ISBN 0-387-40270-5;[19]John Verzani.Using R for Introductory Statistics.Chapman&Hall/CRC,Boca Raton,F(xiàn)L,2005.ISBN 1-584-88450-9;[20]Uwe Ligges.Programmieren mit R.Springer-Verlag,Heidelberg,2005.ISBN 3-540-20727-9,in German;[21]Fionn Murtagh.CorrespondenceAnalysis and Data Coding with JAVA and R.Chapman&Hall/CRC,BocaRaton,F(xiàn)L,2005.ISBN 1-584-88528-9;[22]Paul Murrell.R Graphics.Chapman&Hall/CRC,Boca Raton,F(xiàn)L,2005.ISBN 1-584-88486-X;[23]Michael J.Crawley.StatisticsAn Introduction using R.Wiley,2005.ISBN0-470-02297-3;[24]Brian S.Everitt.An R and S-Plus Companion toMultivariate Analysis.Springer,2005.ISBN 1-85233-882-2;[25]Richard C.Deonier,Simon Tavare,and Michael S.Waterman.Computational GenomeAnalysisAn Introduction.Springer,2005.ISBN0-387-98785-1;[26]Robert Gentleman,Vince Carey,Wolfgang Huber,Rafael Irizarry,andSandrine Dudoit,editors.Bioinformatics and Computational BiologySolutions Using R and Bioconductor.Statistics for Biology and Health.Springer,2005.ISBN0-387-25146-4;[27]Terry M.Therneau and PatriciaM.Grambsch.Modeling Survival DataExtending the Cox Model.Statisticsfor Biology and Health.Springer,2000.ISBN0-387-98784-3)。
與Khvorova論文不同,根據(jù)70%的表達抑制率,將Amarzguioui論文中的數(shù)據(jù)集劃分有效組/無效組。即比較兩種評分方法的預(yù)測成功率,該數(shù)據(jù)集中的差異有望更為準確地得以顯示。結(jié)果如表所示。
表8 根據(jù)表8,在LDA和QDA兩種情況下,與傳統(tǒng)的siRNA效率評分方法相比,本發(fā)明的利用相對結(jié)合能模式的結(jié)合能評分方法中,顯示預(yù)測成功率提高了10%。
實施例2存活素基因表達的抑制實驗 通過本發(fā)明的相對結(jié)合能模式優(yōu)化siRNA設(shè)計的方法,設(shè)計出36個抑制存活素基因表達的siRNA,然后進行存活素基因表達的抑制實驗。根據(jù)75%的表達抑制率,將得到的數(shù)據(jù)集劃分為有效組/無效組。此處,將Khvorova和Amarzguioui論文中的三個數(shù)據(jù)集用作訓(xùn)練集,存活素數(shù)據(jù)集用作測試集。如實施例1相同的方法,給siRNA打分,利用統(tǒng)計程序R,通過LDA(線性判別分析)和QDA(二次方程判別分析)計算siRNA效率的預(yù)測成功率。結(jié)果LDA和QDA兩種情況的預(yù)測成功率都為0.64,顯示與實施例1幾乎相同的結(jié)果(參見表9)。
表9 工業(yè)實用性 如上所述,根據(jù)本發(fā)明的方法,結(jié)果研究人員或?qū)嶒炄藛T無需進行實際的實驗,能夠通過未知siRNA堿基序列對相對結(jié)合能模式進行分析,從而快速確定siRNA是有效還是無效,因此可以使siRNA的設(shè)計和制備效率最大化,并且通過對靶mRNA有效的siRNA有效抑制靶mRNA的表達。
序列表
<110>BIONEER CORPORATION
<120>Method of Inhibiting Expression of Target mRNA Using siRNAConsisting of Nucleotide Sequence Complementary to Said TargetmRNA
使用由互補于所述靶mRNA的核苷酸序列組成的siRNA抑制靶mRNA表達的方法
<160>72
<170>Kopatent In 1.71
<210>1
<211>208
<212>DNA
<213>Homo sapiens
人類
<400>1
gttccaaaaa cagtggataa ttttgtggcc ttagctacag gagagaaagg atttggctac 60
aaaaacagca aattccatcg tgtaatcaag gacttcatga tccagggcgg agacttcacc120
aggggagatg gcacaggagg aaagagcatc tacggtgagc gcttccccga tgagaacttc180
aaactgaagc actacgggcc tggctggg 208
<210>2
<211>200
<212>DNA
<213>Drosophila sp.
果蠅
<400>2
tgaacttccc gccgccgttg ttgttttgga gcacggaaag acgatgacgg aaaaagagat 60
cgtggattac gtcgccagtc aagtaacaac cgcgaaaaag ttgcgcggag gagttgtgtt120
tgtggacgaa gtaccgaaag gtcttaccgg aaaactcgac gcaagaaaaa tcagagagat180
cctcataaag gccaagaagg 200
<210>3
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>functional siRNA sequence for human cyclophil in gene starting at5 position of Seq.ID.No.1
起始于Seq.ID.No.1的5位的人親環(huán)蛋白基因的功能siRNA序列
<400>3
caaaaacagt ggataattt 19
<210>4
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>functional siRNA sequence for human cyclophilin gene starting at27 position of Seq.ID.No.1
起始于Seq.ID.No.1的27位的人親環(huán)蛋白基因的功能siRNA序列
<400>4
ggcctt agct acaggagag19
<210>5
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>functional siRNA sequence for human cyclophilin gene starting at
35 position of Seq.ID.No.1
起始于Seq.ID.No.1的35位的人親環(huán)蛋白基因的功能siRNA序列
<400>5
ctacaggaga gaaaggatt 19
<210>6
<211>19
<212>DNA
<213>Artifici al Sequence
人工序列
<220>
<223>funct ional siRNA sequence for human cyclophilin gene starting at41 posifion of Seq.ID.No.1
起始于Seq.ID.No.1的41位的人親環(huán)蛋白基因的功能siRNA序列
<400>6
gagagaaagg atttggcta 19
<210>7
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>functional siRNA sequence for human cyclophilin gene starting at43 position of Seq.ID.No.1
起始于Seq.ID.No.1的43位的人親環(huán)蛋白基因的功能siRNA序列
<400>7
gagaaaggat ttggctaca19
<210>8
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>functional siRNA sequence for human cyclophilin gene starting at45 position of Seq.ID.No.1
起始于Seq.ID.No.1的45位的人親環(huán)蛋白基因的功能siRNA序列
<400>8
gaaaggattt ggctacaaa 19
<210>9
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>functional siRNA sequence for human cyclophilin gene starting at65 position of Seq.ID.No.1
起始于Seq.ID.No.1的65位的人親環(huán)蛋白基因的功能siRNA序列
<400>9
acagcaaatt ccatcgtgt 19
<210>10
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>functional siRNA sequence for human cyclophilin gene starting at69 position of Seq.ID.No.1
起始于Seq.ID.No.1的69位的人親環(huán)蛋白基因的功能siRNA序列
<400>10
caaattccat cgtgtaatc 19
<210>11
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>functional siRNA sequence for human cyclophilin gene starting at95 position of Seq.ID.No.1
起始于Seq.ID.No.1的95位的人親環(huán)蛋白基因的功能siRNA序列
<400>11
tcatgatcca gggcggaga 19
<210>12
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>functional siRNA sequence for human cyclophilin gene starting at99 position of Seq.ID.No.1
起始于Seq.ID.No.1的99位的人親環(huán)蛋白基因的功能siRNA序列
<400>12
gatccagggc ggagacttc 19
<210>13
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>functional siRNA sequence for human cyclophilin gene starting at131 position of Seq.ID.No.1
起始于Seq.ID.No.1的131位的人親環(huán)蛋白基因的功能siRNA序列
<400>13
gcacaggagg aaagagcat 19
<210>14
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>functional siRNA sequence for human cyclophilin gene starting at139 position of Seq.ID.No.1
起始于Seq.ID.No.1的139位的人親環(huán)蛋白基因的功能siRNA序列
<400>14
ggaaagagca tctacggtg 19
<210>15
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>functional siRNA sequence for human cyclophilin gene starting at159 position of Seq.ID.No.1
起始于Seq.ID.No.1的159位的人親環(huán)蛋白基因的功能siRNA序列
<400>15
gcgcttcccc gatgagaac 19
<210>16
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 7 position of Seq.ID.No.1
起始于Seq.ID.No.1的7位的人親環(huán)蛋白基因的非功能siRNA序列
<400>16
aaaacagtgg ataattttg 19
<210>17
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 9 positionof Seq.ID.No.1
起始于Seq.ID.No.1的9位的人親環(huán)蛋白基因的非功能siRNA序列
<400>17
aacagtggat aattttgtg 19
<210>18
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 11 position of Seq.ID.No.1
起始于Seq.ID.No.1的11位的人親環(huán)蛋白基因的非功能siRNA序列
<400>18
cagtggataa ttttgtggc19
<210>19
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 17 position of Seq.ID.No.1
起始于Seq.ID.No.1的17位的人親環(huán)蛋白基因的非功能siRNA序列
<400>19
ataattttgt ggccttagc 19
<210>20
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 23 posiftion of Seq.ID.No.1
起始于Seq.ID.No.1的23位的人親環(huán)蛋白基因的非功能siRNA序列
<400>20
ttgtggcctt agctacagg 19
<210>21
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene starting at 31 position of Seq.ID.No.1
起始于Seq.ID.No.1的31位的人親環(huán)蛋白基因的非功能siRNA序列
<400>21
ttagctacag gagagaaag19
<210>22
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunct ional siRNA sequence for human cyclophilin gene startingat 51 position of Seq.ID.No.1
起始于Seq.ID.No.1的51位的人親環(huán)蛋白基因的非功能siRNA序列
<400>22
atttggctac aaaaacagc 19
<210>23
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 61 position of Seq.ID.No.1
起始于Seq.ID.No.1的61位的人親環(huán)蛋白基因的非功能siRNA序列
<400>23
aaaaacagca aattccatc 19
<210>24
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 63 position of Seq.ID.No.1
起始于Seq.ID.No.1的63位的人親環(huán)蛋白基因的非功能siRNA序列
<400>24
aaacagcaaa ttccatcgt 19
<210>25
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 73 positionof Seq.ID.No.1
起始于Seq.ID.No.1的73位的人親環(huán)蛋白基因的非功能siRNA序列
<400>25
ttccatcgtg taatcaagg19
<210>26
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 97 position of Seq.ID.No.1
起始于Seq.ID.No.1的97位的人親環(huán)蛋白基因的非功能siRNA序列
<400>26
atgatccagg gcggagact19
<210>27
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 101 position of Seq.ID.No.1
起始于Seq.ID.No.1的1 01位的人親環(huán)蛋白基因的非功能siRNA序列
<400>27
tccagggcgg agacttcac 19
<210>28
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 103 position of Seq.ID.No.1
起始于Seq.ID.No.1的103位的人親環(huán)蛋白基因的非功能siRNA序列
<400>28
cagggcggag acttcacca 19
<210>29
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 113 position of Seq.ID.No.1
起始于Seq.ID.No.1的113位的人親環(huán)蛋白基因的非功能siRNA序列 <400>29
acttcaccag gggagatgg 19
<210>30
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 115 position of Seq.ID.No.1
起始于Seq.ID.No.1的11 5位的人親環(huán)蛋白基因的非功能siRNA序列
<400>30
ttcaccaggg gagatggca 19
<210>31
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 119 position of Seq.ID.No.1
起始于Seq.ID.No.1的119位的人親環(huán)蛋白基因的非功能siRNA序列
<400>31
ccaggggaga tggcacagg 19
<210>32
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 149 position of Seq.ID.No.1
起始于Seq.ID.No.1的149位的人親環(huán)蛋白基因的非功能siRNA序列
<400>32
tctacggtga gcgcttccc 19
<210>33
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 151 position of Seq.ID.No.1
起始于Seq.ID.No.1的151位的人親環(huán)蛋白基因的非功能siRNA序列
<400>33
tacggtgagc gcttccccg19
<210>34
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 171 position of Seq.ID.No.1
起始于Seq.ID.No.1的171位的人親環(huán)蛋白基因的非功能siRNA序列
<400>34
tgagaacttc aaactgaag19
<210>35
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 173 position of Seq.ID.No.1
起始于Seq ID.No.1的173位的人親環(huán)蛋白基因的非功能siRNA序列
<400>35
agaacttcaa actgaagca 19
<210>36
<211>19
<212>DNA
<213>Artificial Sequence
人工序列
<220>
<223>nonfunctional siRNA sequence for human cyclophilin gene startingat 179 position of Seq.ID.No.1
起始于Seq.ID.No.1的179位的人親環(huán)蛋白基因的非功能siRNA序列
<400>36
tcaaactgaa gcact acgg 19
<210>37
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>37
gcaaugucuu aggaaagga 19
<210>38
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA對存活素mRNA特異的siRNA
<400>38
agaauagcac aaacuacaa 19
<210>39
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>39
gagacagaau agagugaua 19
<210>40
<211>19
<212>RNA
<213>Artifici al Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>40
gcgucuggca gauacuccu19
<210>41
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>41
ugcgcuuucc uuucuguca19
<210>42
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>42
gaagcaguuu gaagaauua 19
<210>43
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>43
ugucuuagga aaggagauc 19
<210>44
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>44
ggcagugucc cuuuugcua 19
<210>45
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>45
aauucacaga auagcacaa 19
<210>46
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>46
aagcacaaag ccauucuaa19
<210>47
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>47
ggcaguggcc uaaauccuu 19
<210>48
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>48
ggcugaaguc uggcguaag 19
<210>49
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>49
gcugaagucu ggcguaaga 19
<210>50
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>50
cggcuguucc ugagaaaua 19
<210>51
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>51
aaggaccacc gcaucucua 19
<210>52
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>52
ggaccaccgc aucucuaca 19
<210>53
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>53
ccgguugcgc uuuccuuuc 19
<210>54
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>54
gcugcuucuc ucucucucu 19
<210>55
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>55
gugaugagag aauggagac 19
<210>56
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>56
ggagacagaa uagagugau 19
<210>57
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>57
ccuucacauc ugucacguu 19
<210>58
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>58
gauuguuaca gcuucgcug 19
<210>59
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>59
ucaaggacca ccgcaucuc 19
<210>60
<211>19
<212>RNA
<213>Artifici al Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>60
gaccaccgca ucucuacau 19
<210>61
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>61
aagcauucgu ccgguugcg 19
<210>62
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>62
uucguccggu ugcgcuuuc 19
<210>63
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>63
acugcgaaga aagugcgcc 19
<210>64
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>64
gaaggcagug ucccuuuug19
<210>65
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>65
gacagcuuug uucgcgugg 19
<210>66
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>66
ugugucugga ccucauguu 19
<210>67
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>67
acuaagcaca aagccauuc 19
<210>68
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>68
agccauucua agucauugg 19
<210>69
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>69
gccauucuaa gucauuggg 19
<210>70
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>70
cacugcugug ugauuagac 19
<210>71
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>71
uuaaaugacu uggcucgau 19
<210>72
<211>19
<212>RNA
<213>Artificial Sequence
人工序列
<220>
<223>siRNA specific for survivin mRNA
對存活素mRNA特異的siRNA
<400>72
ccaaccuuca caucuguca 19
權(quán)利要求
1.一種使用siRNA抑制靶mRNA表達的方法,包括步驟
(1)獲得ds(雙鏈)RNA序列的所有組合,其中每個RNA序列都由n個與預(yù)定靶mRNA互補的核苷酸(n為整數(shù))組成;
(2)獲得每個dsRNA的EA、EB、EC和ED,其分別為所述dsRNA堿基序列中的第1-2位結(jié)合能位置構(gòu)成的段(A)、第3-7位結(jié)合能位置構(gòu)成的段(B)、第8-15位結(jié)合能位置構(gòu)成的段(C)和第16-18位結(jié)合能位置構(gòu)成的段(D)的平均結(jié)合能數(shù)值;
(3)根據(jù)下列方程,將Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)分配到(A)至(D)的各段,
i)如果-0.02<EA-EB<0.38、-0.29<EB-EC<-0.01、0.00<EC-ED<0.35、0.07<ED-EA<0.37,那么每個Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)為10分,
ii)如果-0.63<EA-EB<-0.21、0.05<EB-EC<0.44、-0.47<EC-ED<-0.09、-0.67<ED-EA<-0.23,那么每個Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)為0分,
iii)如果EA-EB、EB-EC、EC-ED和ED-EA不屬于(i)和(ii)限定的范圍內(nèi),那么每個Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)為5分;
(4)根據(jù)下述方程4,分配每個dsRNA的相對結(jié)合能值Y
[方程4]
其中W(A-B)、W(B-C)、W(C-D)和W(A-D)分別是(A-B)段、(B-C)段、(C-D)段和(A-D)段的加權(quán),其范圍分別為0.90-1.00、0.2-0.4、0.2-0.3和0.7-0.9;
(5)根據(jù)下述方程5,分配每個dsRNA的Z值
[方程5]
其中i為整數(shù),代表影響siRNA對靶mRNA抑制效率的因子,其中至少有一個是siRNA的相對結(jié)合能,
Zi是給每個因子的分值,假設(shè)Z1=Y(jié),代表相對結(jié)合能,
Mi是分配給每個因子的預(yù)定最大值,和
Wi是基于W1分配給每個因子的預(yù)定加權(quán);
(6)將在步驟(5)獲得的每個dsRNA的Z值降序排列,從而篩選dsRNA的預(yù)定前%;以及
(7)應(yīng)用篩選的dsRNAs抑制靶mRNA表達。
2.根據(jù)權(quán)利要求1所述的方法,其中所述siRNA為21個核苷酸的雙鏈RNA,n為21。
3.根據(jù)權(quán)利要求1或2所述的方法,其中所述siRNA在dsRNA部分和19個核苷酸的兩個3′端具有1-3個核苷酸的突出結(jié)構(gòu)。
4.根據(jù)權(quán)利要求1所述的方法,其中所述加權(quán)因子W(A-B)、W(B-C)、W(C-D)和W(A-D)分別為1.00、0.37、0.20和0.90。
5.根據(jù)權(quán)利要求1所述的方法,其中在步驟(5)中影響siRNA對靶mRNA抑制效率的因子包括作為必需因子的相對結(jié)合能以及選自3′端5個堿基中的A/U數(shù)、第1位置G/C的存在、第19位置A/U的存在、G/C含量、Tm、RNA的二級結(jié)構(gòu)、與其它mRNA的同源性的一個或多個因子作為任選因子。
6.根據(jù)權(quán)利要求1或5所述的方法,其中步驟(5)的方程5的特征是i=5;Z1=相對結(jié)合能分值(Y),Z2=分配給3′端5個堿基中的A/U數(shù)的分值,Z3=分配給第1位置G/C存在的分值,Z4=分配給第19位置A/U存在的分值,Z5=分配給G/C含量的分值;M1-M5分別為100、5、1、1、10;W1-W5分別為0.90、0.07、0.15、0.19、0.11。
7.根據(jù)權(quán)利要求1所述的方法,其中步驟(5)的預(yù)定%是前10%。
8.一種使用siRNA抑制靶mRNA表達的方法,包括步驟
(1)獲得ds(雙鏈)RNA序列的所有組合,其中每個RNA序列都由n個與預(yù)定靶mRNA互補的核苷酸(n為整數(shù))組成;
(2)獲得每個dsRNA的EA、EB、EC和ED,其分別為所述dsRNA堿基序列中的第1-2位結(jié)合能位置構(gòu)成的段(A)、第3-6位結(jié)合能位置構(gòu)成的段(B)、第14-16位結(jié)合能位置構(gòu)成的段(C)和第16-18位結(jié)合能位置構(gòu)成的段(D)的平均結(jié)合能數(shù)值;
(3)根據(jù)下列方程,將Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)分配到(A)至(D)的各段,
i)如果0.00<EA-EB<0.40、-0.41<EB-EC<-0.01、0.07<EC-ED<0.39、0.07<ED-EA<0.37,那么每個Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)為10分,
ii)如果-0.63<EA-EB<-0.21、0.10<EB-EC<0.51、-0.47<EC-ED<-0.19、-0.67<ED-EA<-0.23,那么每個Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)為0分,
iii)如果EA-EB、EB-EC、EC-ED和ED-EA不屬于(i)和(ii)限定的范圍內(nèi),那么每個Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)為5分;
(4)根據(jù)下述方程4,分配每個dsRNA的相對結(jié)合能值Y
[方程4]
其中W(A-B)、W(B-C)、W(C-D)和W(A-D)分別是(A-B)段、(B-C)段、(C-D)段和(A-D)段的加權(quán),其范圍分別為0.5-0.7、0.3-0.5、0.3-0.5和0.9-1.0;
(5)根據(jù)下述方程5,分配每個dsRNA的Z值
[方程5]
其中i為整數(shù),代表影響siRNA對靶mRNA抑制效率的因子,其中至少有一個是siRNA的相對結(jié)合能,
Zi是給每個因子的分值,假設(shè)Z1=Y(jié),代表相對結(jié)合能,
Mi是分配給每個因子的預(yù)定最大值,和
Wi是基于W1分配給每個因子的預(yù)定加權(quán);
(6)將在步驟(5)獲得的每個dsRNA的Z值降序排列,從而篩選dsRNA的預(yù)定前%;以及
(7)應(yīng)用篩選的dsRNAs抑制靶mRNA表達。
9.根據(jù)權(quán)利要求8所述的方法,其中siRNA為21個核苷酸的雙鏈RNA,n為21。
10.根據(jù)權(quán)利要求8或9所述的方法,其中所述siRNA在dsRNA部分和19個核苷酸的兩個3′端具有1-3個核苷酸的突出結(jié)構(gòu)。
11.根據(jù)權(quán)利要求8的方法,其中加權(quán)因子W(A-B)、W(B-C)、W(C-D)和W(A-D)分別為0.65、0.48、0.48和0.90。
12.根據(jù)權(quán)利要求8所述的方法,其中在步驟(5)中影響siRNA對靶mRNA抑制效率的因子包括作為必需因子的相對結(jié)合能以及選自3′端5個堿基中的A/U數(shù)、第1位置G/C的存在、第19位置A/U的存在、G/C含量、Tm、RNA的二級結(jié)構(gòu)、與其它mRNA的同源性的一個或多個因子作為任選因子。
13.根據(jù)權(quán)利要求8或12所述的方法,其中步驟(5)的方程5的特征是i=5;Z1=相對結(jié)合能分值(Y),Z2=分配給3′端5個堿基中的A/U數(shù)的分值,Z3=分配給第1位置G/C的存在的分值,Z4=分配給第19位置A/U的存在的分值,Z5=分配給G/C含量的分值;M1-M5分別為100、5、1、1、10;W1-W5分別為0.90、0.07、0.15、0.19、0.11。
14.根據(jù)權(quán)利要求8所述的方法,其中步驟(5)的預(yù)定%是前10%。
15.一種優(yōu)化siRNA設(shè)計的方法,包括步驟
(1)獲得ds(雙鏈)RNA序列的所有組合,其中每個RNA序列都由n個與預(yù)定靶mRNA互補的核苷酸(n為整數(shù))組成;
(2)獲得每個dsRNA的EA、EB、EC和ED,其分別為所述dsRNA堿基序列中的第1-2位結(jié)合能位置構(gòu)成的段(A)、第3-7位結(jié)合能位置構(gòu)成的段(B)、第8-15位結(jié)合能位置構(gòu)成的段(C)和第16-18位結(jié)合能位置構(gòu)成的段(D)的平均結(jié)合能數(shù)值;
(3)根據(jù)下列方程,將Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)分配到(A)至(D)的各段,
i)如果-0.02<EA-EB<0.38、-0.29<EB-EC<-0.01、0.00<EC-ED<0.35、0.07<ED-EA<0.37,那么每個Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)為10分,
ii)如果-0.63<EA-EB<-0.21、0.05<EB-EC<0.44、-0.47<EC-ED<-0.09、-0.67<ED-EA<-0.23,那么每個Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)為0分,
iii)如果EA-EB、EB-EC、EC-ED和ED-EA不屬于(i)和(ii)限定的范圍內(nèi),那么每個Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)為5分;
(4)根據(jù)下述方程4,分配每個dsRNA的相對結(jié)合能值Y
[方程4]
其中W(A-B)、W(B-C)、W(C-D)和W(A-D)分別是(A-B)段、(B-C)段、(C-D)段和(A-D)段的加權(quán),其范圍分別為0.90-1.00、0.2-0.4、0.2-0.3和0.7-0.9;
(5)根據(jù)下述方程5,分配每個dsRNA的Z值
[方程5]
其中i為整數(shù),代表影響siRNA對靶mRNA抑制效率的因子,其中至少有一個是siRNA的相對結(jié)合能,
Zi是給每個因子的分值,假設(shè)Z1=Y(jié),代表相對結(jié)合能,
Mi是分配給每個因子的預(yù)定最大值,和
Wi是基于W1分配給每個因子的預(yù)定加權(quán);
(6)將在步驟(5)獲得的每個dsRNA的Z值降序排列,從而篩選dsRNA的預(yù)定前%。
16.一種優(yōu)化siRNA設(shè)計的方法,包括步驟
(1)獲得ds(雙鏈)RNA序列的所有組合,其中每個RNA序列都由n個與預(yù)定靶mRNA互補的核苷酸(n為整數(shù))組成;
(2)獲得每個dsRNA的EA、EB、EC和ED,其分別為所述dsRNA堿基序列中的第1-2位結(jié)合能位置構(gòu)成的段(A)、第3-6位結(jié)合能位置構(gòu)成的段(B)、第14-16位結(jié)合能位置構(gòu)成的段(C)和第16-18位結(jié)合能位置構(gòu)成的段(D)的平均結(jié)合能數(shù)值;
(3)根據(jù)下列方程,將Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)分配到(A)至(D)的各段,
i)如果0.00<EA-EB<0.40、-0.41<EB-EC<-0.01、0.07<EC-ED<0.39、0.07<ED-EA<0.37,那么每個Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)為10分,
ii)如果-0.63<EA-EB<-0.21、0.10<EB-EC<0.51、-0.47<EC-ED<-0.19、-0.67<ED-EA<-0.23,那么每個Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)為0分,
iii)如果EA-EB、EB-EC、EC-ED和ED-EA不屬于(i)和(ii)限定的范圍內(nèi),那么每個Y(A-B)、Y(B-C)、Y(C-D)和Y(A-D)為5分;
(4)根據(jù)下述方程4,分配每個dsRNA的相對結(jié)合能值Y
[方程4]
其中W(A-B)、W(B-C)、W(C-D)和W(A-D)分別是(A-B)段、(B-C)段、(C-D)段和(A-D)段的加權(quán),其范圍分別為0.5-0.7、0.3-0.5、0.3-0.5和0.9-1.0;
(5)根據(jù)下述方程5,分配每個dsRNA的Z值
[方程5]
其中i為整數(shù),代表影響siRNA對靶mRNA抑制效率的因子,其中至少有一個是siRNA的相對結(jié)合能,
Zi是給每個因子的分值,假設(shè)Z1=Y(jié),代表相對結(jié)合能,
Mi是分配給每個因子的預(yù)定最大值,和
Wi是基于W1分配給每個因子的預(yù)定加權(quán);
(6)將在步驟(5)獲得的每個dsRNA的Z值降序排列,從而篩選dsRNA的預(yù)定前%。
全文摘要
一種抑制靶mRNA表達的方法,包括(a)獲得包含與隨機靶mRNA互補的核苷酸的dsRNA序列所有組合的雙鏈組合段的結(jié)合能;(b)在每種組合的dsRNA序列上,將該結(jié)合能劃分為四個段,獲得各段之間的平均結(jié)合能差異,并將其轉(zhuǎn)化為相對結(jié)合能模式的分值;(c)通過將轉(zhuǎn)化的分值與可影響siRNA效率的其他因子應(yīng)用到dsRNA序列,篩選那些預(yù)計對靶RNA具有高抑制效率的siRNA;以及(d)利用篩選的siRNA抑制靶mRNA的表達。結(jié)果研究人員或?qū)嶒炄藛T無需進行實際的實驗,能夠通過未知siRNA堿基序列對相對結(jié)合能模式進行分析,從而快速確定siRNA是有效還是無效,因此可以使siRNA的設(shè)計和制備效率最大化,并且通過對靶mRNA有效的siRNA有效抑制靶mRNA的表達。
文檔編號A61K48/00GK101120099SQ200580047832
公開日2008年2月6日 申請日期2005年12月8日 優(yōu)先權(quán)日2004年12月8日
發(fā)明者崔泳哲, 樸翰浯, 鄭素林, 金永柱, 金尚洙, 樸城敏, 金相喆, 尹圭晚, 崔慶玉, 姜孝晉 申請人:株式會社百奧尼