一種基于生物信息學篩選siRNA的方法
【專利摘要】本發(fā)明提供一種基于生物信息學篩選siRNA的方法。通過本發(fā)明方法得到的siRNA能夠沉默或抑制人呼吸道病毒基因,而不沉默或抑制人類基因;所述方法包括:1)提供人呼吸道病毒的全基因序列;2)以人呼吸道病毒的全基因序列為模板,設計第一候選siRNA序列,使得第一候選siRNA序列能夠沉默或抑制所述人呼吸道病毒基因;并且3)通過比對分析來排除對人類基因能夠產(chǎn)生脫靶效應的第一候選siRNA序列,得到第二siRNA序列,該第二siRNA不沉默或抑制人類基因。通過采用本發(fā)明方法,能夠針對新突發(fā)性呼吸道病毒疫情進行快速反應,避免重大疫情的蔓延,并且由這種方法得到的siRNA類藥物適合粘膜免疫。
【專利說明】—種基于生物信息學篩選siRNA的方法
【技術領域】
[0001]本發(fā)明涉及小核酸藥物領域,具體而言涉及基于生物信息學篩選針對呼吸道病毒的SiRNA的方法、由該方法得到的siRNA、藥物組合物、用途、裝置。
【背景技術】
[0002]呼吸道病毒是指能侵犯呼吸道引起呼吸道局部病變或僅以呼吸道為侵入門戶,主要引起呼吸道外組織器官病變的病毒。呼吸道病毒多為RNA病毒,當RNA病毒在活細胞內(nèi)迅速增殖(基因組復制和病毒體裝配)時,它們可以在短期內(nèi)較容易地在不同組織中改變其遺傳結(jié)構(gòu),變異性極強。
[0003]在呼吸道病毒中,流行性感冒病毒(influenza virus,簡稱為流感病毒),特別是甲型流感病毒在引起人類流感流行上最為重要,是反復流行最為頻繁和引起真正全球流行的重要病原體。在分類學上,流感病毒屬于正黏液病毒科,它會造成急性上呼吸道感染,并借由空氣迅速的傳播,在世界各地常會有周期性的大流行。流感病毒在免疫力較弱的老人或小孩及一些免疫失調(diào)的病人會引起較嚴重的癥狀,如肺炎或是心肺衰竭等。
[0004]呼吸道病毒也包括冠狀病毒,而一種前所未知的冠狀病毒則造成了全球非典災難。非典是于2002年在中國廣東首發(fā),并擴散至東南亞乃至全球,直至2003年中期疫情才被逐漸消滅的一次全球性傳染病疫潮。研究報道表明,SARS冠狀病毒(SARS Coronavirus,SARS-CoV)就是導致嚴重急性呼吸道綜合癥(SARS)的病原體。
[0005]可以看到,呼吸道病毒感染導致的疾病疫情具有突發(fā)性、易變性、急迫性和蔓延難控性等特點。在新的病毒疫情發(fā)生時,若采用傳統(tǒng)藥物創(chuàng)制方式,至少需要采用3年以上時間,其中至少需要半年左右的時間進行研制,而接著進行放大生產(chǎn)時還會面臨難度大、成本高的問題,之后的臨床研究驗證藥物在人體中的安全性和有效性又需要2年左右的時間。即使這樣得到了可以上市的藥物,由于通常其粘膜免疫防護力低,也無法有效應對新的疫情。因此,如何快速研制得到結(jié)構(gòu)新穎、具有針對性的抗呼吸道病毒感染的藥物具有極為重要的意義。
[0006]新型小核酸藥物應對呼吸道病毒感染導致的疾病疫情具有獨特優(yōu)勢。小核酸藥物創(chuàng)制的科學基礎來源于RNA干擾(RNA interference, RNAi)原理,這是近十年來生物醫(yī)學領域的重大突破,除了已成為基因功能研究等生物學基本工具外,也成為一種高效的疾病治療手段研發(fā)的利器,國外已經(jīng)有多個藥物進入不同的臨床測試階段。
[0007]RNAi技術是一種生物體內(nèi)具有的內(nèi)源性基因抑制過程,主要機制是通過小干擾核酸(siRNA)(簡稱小核酸)引導特定的核酸酶促進信使RNA (mRNA)降解,降低蛋白表達水平。RNAi技術為生物醫(yī)學工作者提供了一種幾乎可以抑制所有基因表達的有效手段,已經(jīng)成為一種被廣泛接受用于基因功能檢測和疾病治療的工具,具有廣闊的治療應用價值。RNAi作為新的治療方法具有以下幾個方面的顯著特點:l)RNAi是轉(zhuǎn)錄后的基因沉默技術,可以有效地抑制目標基因表達,并降低相關蛋白水平從而放大抑制效果,因此比傳統(tǒng)小分子或抗體藥物的抑制蛋白活性的作用途徑效果更徹底;2) siRNA為一寡義核苷酸鏈,適用于大多數(shù)的目標基因,可以被很容易的合成;3) siRNA生物降解性強,沒有明顯毒性;4)在大多數(shù)基因中只需篩選少量候選者就可確定最有效的siRNA序列(優(yōu)于反義RNA技術);5)由于不同序列的siRNA的化學性質(zhì)很相似,所以可以同時運用多種或兩種siRNA來抑制不同基因的表達。在調(diào)控基因多、影響因素多或發(fā)展步驟多的疾病(如傷口、腫瘤或病毒感染性疾病)治療中最后一點顯得尤為重要。
[0008]然而,雖然小核酸藥物在腫瘤、病毒及心血管等重大疾病防治藥物研發(fā)中已有多個進入臨床前研究,但在藥物遞送、靶向、產(chǎn)業(yè)化制備規(guī)模及成本、對人的安全性等方面依然存在瓶頸問題,在病毒感染傳染病應急藥物研發(fā)領域這些問題更加突出,因此需要開拓新思路,建立新技術和新途徑來解決上述瓶頸問題,以加快其產(chǎn)業(yè)化步伐,特別是提高應急新藥研發(fā)中從“基因到藥物”的效率。
[0009]因此,目前仍然迫切需要提供一種能夠針對新突發(fā)性呼吸道病毒疫情的,迅速、安全、有效且特異性強的新型應對方法。
【發(fā)明內(nèi)容】
[0010]為解決上述現(xiàn)有技術中存在的問題,本發(fā)明提供了一種基于生物信息學篩選siRNA的方法、由所述的方法得到的siRNA、包含該siRNA的藥物組合物、所述的siRNA的制藥用途、以及基于生物信息學篩選siRNA的裝置。
[0011]具體而言,本發(fā)明提供:
[0012](I) 一種基于生物信息學篩選siRNA的方法,其中,通過該方法得到的siRNA能夠沉默或抑制人呼吸道病毒基因,而不沉默或抑制人類基因;
[0013]其中,所述方法包括:
[0014]I)提供所述人呼吸道病毒的全基因序列;
[0015]2)以所述人呼吸道病毒的所述全基因序列為模板,設計N條第一候選siRNA序列,使得所述第一候選siRNA序列能夠沉默或抑制所述人呼吸道病毒基因,其中N ^ 2 ;并且
[0016]3)通過比對分析來排除對人類基因能夠產(chǎn)生脫靶效應的第一候選siRNA序列,得到第二 siRNA序列,該第二 siRNA不沉默或抑制人類基因。
[0017](2)根據(jù)(I)所述的方法,其中,在進行所述步驟3)之前,將由所述步驟2)得到的所述第一候選siRNA序列按其種子區(qū)與祀序列形成的雙螺旋熱力學穩(wěn)定性(seed duplexstability)進行排序,然后將其中穩(wěn)定性最高的M條第一候選siRNA序列進行所述步驟3),其中M彡I。
[0018](3)根據(jù)(I)所述的方法,其中在所述步驟3)中,該第二 siRNA序列所針對的靶位點與所述人類基因組序列有I個以上堿基不匹配;
[0019]優(yōu)選地,對所得到的第二 siRNA序列進行進一步選擇,使得該第二 siRNA序列所針對的靶位點與所述人類基因組序列的堿基匹配數(shù)最低,并且/或者使得該第二 siRNA序列的種子區(qū)與所述人類基因組序列的3’端非編碼區(qū)有I個以上堿基不匹配。
[0020](4)根據(jù)(I)- (3)中任意一項所述的方法,其中所述方法還包括:
[0021]4)將步驟3)得到的第二 siRNA序列的3’末端加上2個脫氧胸腺嘧啶核苷酸,得到第三siRNA序列的正義鏈,并且在該第二 siRNA序列的互補序列的3’末端加上2個脫氧胸腺嘧啶核苷酸,得到該第三siRNA序列的反義鏈。
[0022](5)根據(jù)(I)所述的方法,其中所述人呼吸道病毒包括流感病毒、副流感病毒、呼吸道合胞病毒、麻疫病毒、腿腺炎病毒、腺病毒、風疫病毒、鼻病毒、冠狀病毒和/或呼腸病毒;優(yōu)選為流感病毒;更優(yōu)選為甲型流感病毒;進一步優(yōu)選為H1、H3、H5、H7或H9甲型流感病毒。
[0023](6) 一種根據(jù)(I) - (5)中任意一項所述的方法得到的siRNA。
[0024](7)根據(jù)(6)所述的siRNA,其中所述siRNA具有化學修飾,并且所述化學修飾包括:磷酸骨架修飾、核糖修飾和/或堿基修飾。
[0025](8) —種藥物組合物,其包含作為活性成分的(6)或(7)所述的siRNA以及藥用輔料;優(yōu)選地,所述藥物組合物被制成為噴霧劑。
[0026](9)根據(jù)(6)或(7)所述的siRNA在制備用于預防和/或治療人呼吸道病毒感染的疾病的藥物中的用途。
[0027](10)—種用于基于生物信息學篩選siRNA的裝置,其中,通過該裝置得到的siRNA能夠沉默或抑制人呼吸道病毒基因,而不沉默或抑制人類基因;
[0028]其中,所述裝置包括:
[0029]I)第一單元,該第一單元用于提供所述人呼吸道病毒的全基因序列;
[0030]2)第二單元,該第二單元用于以所述人呼吸道病毒的所述全基因序列為模板,設計N條第一候選siRNA序列,使得所述第一候選siRNA序列能夠沉默或抑制所述人呼吸道病毒基因,其中N彡2 ;以及
[0031]3)第三單元,該第三單元用于通過比對分析來排除對人類基因能夠產(chǎn)生脫靶效應的第一候選siRNA序列,得到第二 siRNA序列,該第二 siRNA不沉默或抑制人類基因。
[0032]本發(fā)明與現(xiàn)有技術相比具有以下優(yōu)點和積極效果:
[0033]現(xiàn)有技術中通常在設計得到SiRNA后,進行同源性比對來避免所設計的小核酸由于和病毒中非靶點基因結(jié)合而降低藥效。而本發(fā)明通過特定方式的比對分析來排除對人類基因能夠產(chǎn)生脫靶效應的siRNA序列,從而降低或避免對人體產(chǎn)生的毒副作用。從而,本發(fā)明通過基于生物信息學篩選siRNA的方法,可在幾天之內(nèi)就完成從新病毒株測序、siRNA設計和篩選、通過藥物的快速審批通道使新的抗病毒藥物快速上市、對新藥進行快速合成和放大的整個過程,從而能夠針對新突發(fā)性呼吸道病毒疫情進行快速反應,避免重大疫情的蔓延。并且由這種方法得到的siRNA類藥物適合粘膜免疫。
【具體實施方式】
[0034]以下通過【具體實施方式】的描述對本發(fā)明作進一步說明,但這并非是對本發(fā)明的限制,本領域技術人員根據(jù)本發(fā)明的基本思想,可以做出各種修改或改進,但是只要不脫離本發(fā)明的基本思想,均在本發(fā)明的范圍之內(nèi)。
[0035]眾所周知,藥物是新突發(fā)傳染病防治的最重要的有效手段之一,但是由于藥物研發(fā)自身規(guī)律的限制,需要較長的研發(fā)周期,無法適應新突發(fā)傳染病,特別是病毒性傳染病防控的需要。因此亟需建立新技術,開辟新途徑以滿足新突發(fā)病毒性傳染病應急防治藥物的研發(fā),使其能在短時間內(nèi)用于傳染病疫情的控制,從而達到早期防治以減低病死率并控制傳播速度。
[0036]此外,對于絕大多數(shù)細菌性感染引起的傳染病,雖然存在耐藥等問題,但基本都可以用抗生素為主的各種藥物控制;然而對于病毒性傳染病的藥物治療人類基本是束手無策,除HBV、HIV等屈指可數(shù)的幾種病毒有治療藥物外,其它絕大度數(shù)病毒感染根本沒有特效的防治藥物,基本采用對癥治療,甚至依靠病人自身的抵抗力。即使現(xiàn)有的幾種藥物也存在特異性差、耐藥及毒副作用大等問題。
[0037]進一步而言,小核酸藥物雖然在腫瘤、病毒及心血管等重大疾病防治藥物研發(fā)中已有多個進入臨床前研究,但在藥物遞送、祀向、產(chǎn)業(yè)化制備規(guī)模及成本、對人的安全性等方面依然存在瓶頸問題,在病毒感染傳染病應急藥物研發(fā)領域這些問題更加突出,因此需要開拓新思路,建立新技術和新途徑來解決上述瓶頸問題,以加快其產(chǎn)業(yè)化步伐,特別是提高應急新藥研發(fā)中從“基因到藥物”的效率。
[0038]為此,本發(fā)明人通過深入研究小核酸的設計與篩選評價方法,發(fā)現(xiàn)并提供了能夠針對新突發(fā)性呼吸道病毒疫情的,迅速、安全、有效且特異性強的新型應對方法,該方法通過采用生物信息學手段來篩選評價小核酸,從而能夠得到對人呼吸道病毒的特異性抑制作用強,而由脫靶效應產(chǎn)生的人體毒副作用低的小核酸。小核酸本事易于合成,因此可快速合成和放大;并且在應對新突發(fā)性呼吸道病毒疫情時,由該小核酸制成的藥物在進行生物學試驗和臨床試驗驗證藥效前,就可通過藥物的快速審批通道快速上市。這樣能夠針對突發(fā)性呼吸道病毒疫情進行快速反應,避免重大疫情的蔓延。
[0039]因此,由本發(fā)明方法得到的小核酸在應對新突發(fā)性呼吸道病毒疫情暴發(fā)方面的干預效果,具有其它傳統(tǒng)藥物所不具備的優(yōu)勢:所得小核酸藥物可以在初步得到突變病毒的序列后,在相對較短的時間內(nèi)(一周或數(shù)周),即可完成病毒抑制藥物的設計、篩選和大規(guī)模生產(chǎn)。這是因為傳統(tǒng)新藥創(chuàng)制需要進行長時間的藥效、急毒/慢毒等臨床前實驗以及1、11、III期臨床試驗的摸索,而經(jīng)過數(shù)年試驗,藥物研發(fā)成功后,病毒可能已經(jīng)發(fā)生變異,使得這類藥物的研究成為“馬后炮”。本發(fā)明根據(jù)生物信息學的最新進展,可以進行人類及病毒基因組高通量掃描,通過比對分析,篩選出對人類基因基本無毒副作用的序列,使得原本需要數(shù)年完成的摸索,有可能在短期即可完成,進而申報成藥,從而形成遏制由新呼吸道病毒引起的疫情爆發(fā)流行的有效手段,這是所有現(xiàn)行病毒治療藥物(如疫苗、單克隆抗體藥)的研發(fā)過程所無法比擬的。
[0040]本發(fā)明的一個目的在于提供一種基于生物信息學篩選siRNA的方法。本發(fā)明的另一個目的在于提供由所述的方法得到的siRNA。本發(fā)明的又一個目的在于提供包含該siRNA的藥物組合物。本發(fā)明的又一個目的在于提供所述的siRNA的制藥用途。本發(fā)明的又一個目的在于提供基于生物信息學篩選siRNA的裝置。
[0041](一)基于生物信息學篩選siRNA的方法
[0042]本發(fā)明的第一個方面提供了一種基于生物信息學篩選siRNA的方法,其中,通過該方法得到的siRNA能夠沉默或抑制人呼吸道病毒基因,而不沉默或抑制人類基因;
[0043]其中,所述方法包括:
[0044]I)提供所述人呼吸道病毒的全基因序列;
[0045]2)以所述人呼吸道病毒的所述全基因序列為模板,設計N條第一候選siRNA序列,使得所述第一候選siRNA序列能夠沉默或抑制所述人呼吸道病毒基因,其中N ^ 2 ;并且
[0046]3)通過比對分析來排除對人類基因能夠產(chǎn)生脫靶效應的第一候選siRNA序列,得到第二 siRNA序列,該第二 siRNA不沉默或抑制人類基因。
[0047]在本文中,術語“生物信息學(B1informatics)”在本領域是已知的,其是指在生命科學的研究中,以計算機為工具對生物信息進行儲存、檢索和分析的科學。通常而言,生物信息學將分子生物學與信息技術(尤其是因特網(wǎng)技術)結(jié)合在一起。生物信息學的研究材料和結(jié)果包括各種各樣的生物學數(shù)據(jù),其研究工具包括計算機,研究方法包括對生物學數(shù)據(jù)的搜索(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計算、模擬)。
[0048]在本文中,術語“siRNA (小干擾核酸,簡稱小核酸)”在本領域是已知的,其是指帶有特定基因密碼的雙鏈短小核酸,一般長度為21-23bp (堿基對)。siRNA雙鏈中和信使RNA(mRNA)的祀向序列相同的鏈稱為正義鏈,與之互補的另一條鏈為反義鏈。siRNA包括5’ -磷酸末端、19nt的雙鏈區(qū)、3’ -羥基末端和2個不配對的3’端核苷酸突起,可指導mRNA的裂解。一般而言,一個基因通常含有數(shù)千個bp,siRNA是其中長度為21?23bp的某一段特異序列。siRNA可以克隆到siRNA表達載體,其功能是在哺乳動物細胞內(nèi)和特定靶基因的信使核糖核酸(mRNA)結(jié)合,使之降解,失去靶基因表達而“沉默”下來,即“關閉”該基因的功能。這種siRNA降解mRNA從而阻斷特定蛋白質(zhì)合成的機制即為核酸干擾(RNAi)。
[0049]在本文中,術語“核酸干擾(或RNA干擾)(RNA interference, RNAi)”在本領域是已知的,其是指在進化過程中高度保守的、由雙鏈RNA (double-stranded RNA,dsRNA)誘發(fā)的、同源mRNA高效特異性降解的現(xiàn)象。RNAi —經(jīng)發(fā)現(xiàn),迅速成為生物學研究領域最為活躍的熱點之一,《Science》在2001年將其列為十大科學成就之一,2002年又將其列為十大科技之首;《Nature》也將siRNA評為2002年度最重要的科技發(fā)現(xiàn)之一 ;2006年發(fā)現(xiàn)RNAi機理的兩位美國科學家法爾和梅洛獲得諾貝爾醫(yī)學獎。RNAi技術可以特異性剔除或關閉特定基因的表達,是一種快速、有效、特異的抑制基因表達的工具,已被廣泛用于探索基因功能、病毒性疾病(主要是艾滋病和肝炎)及惡性腫瘤的基因治療領域。一方面,RNAi是基因功能檢驗的試金石,利用RNAi技術可以大幅度縮短人類對人類基因功能與作用的了解和認識的時間;另一方面,可以利用RNAi技術獲得使致病基因失活的新型基因藥物,即siRNA藥物。
[0050]在本文中,術語“脫祀效應(off-target effect)”在本領域是已知的,其是指siRNA作用過程中存在非特異性,可能與非靶基因之外的其它基因作用而非特異地阻斷基因表達,產(chǎn)生意料之外的效用。與siRNA相關的脫靶效應分成三大類型:micr0RNA(miRNA)樣脫靶效應、免疫刺激、RNAi元件飽和。
[0051]在本文中,術語“呼吸道病毒”在本領域是已知的,其是指一大類能侵犯呼吸道引起呼吸道局部病變或僅以呼吸道為侵入門戶,主要引起呼吸道外組織器官病變的病毒。呼吸道病毒包括正粘病毒科(Orthomyxoviridae)中的流感病毒;副粘病毒科(Paramyxoviridae)中的副流感病毒、呼吸道合胞病毒、麻疫病毒、腿腺炎病毒以及其它病毒科中的一些病毒,如腺病毒、風疫病毒、鼻病毒、冠狀病毒和呼腸病毒等。據(jù)統(tǒng)計,90%以上急性呼吸道感染由病毒引起。
[0052]在本文中,術語“流行性感冒病毒”(influenza virus,簡稱流感病毒)是本領域是已知的,其有甲(A)乙(B)丙(C)三型,引起人和動物(豬、馬、海洋哺乳動物和禽類等)流行性感冒(簡稱流感)。
[0053]在本文中,術語“人類基因組”是本領域是已知的,是指人類(Homo sapiens)的基因組,由23對染色體組成,含有約31.6億個DNA堿基對。其中一部分的堿基對組成了大約20000到25000個基因。全部人類基因組測序工作已于2006年完成,并且人類基因組序列是公開可得的。
[0054]在本發(fā)明方法中,步驟I)所述的“提供所述人呼吸道病毒的全基因序列”包括提供已知的人呼吸道病毒的全基因序列或新的人呼吸道病毒的全基因序列。已知的人呼吸道病毒的全基因序列可以直接從公共數(shù)據(jù)庫Genebank得到,新的人呼吸道病毒的全基因序列可以通過已知方法對新病毒株進行分離、提取(例如)RNA、測定序列得到,并可進一步進行基因分型。
[0055]在本發(fā)明方法中,步驟2)所述的“以所述人呼吸道病毒的所述全基因序列為模板,設計N條第一候選siRNA序列,使得所述第一候選siRNA序列能夠沉默或抑制所述人呼吸道病毒基因,其中N ^ 2”優(yōu)選包括:以人呼吸道病毒的全基因序列的保守區(qū)為模板,使用已知的公共或商業(yè)siRNA設計工具(例如Invitrogen、GenScript、Dharmacon和/或siDirect等)按本領域公知的siRNA設計原則設計第一候選siRNA序列。
[0056]siRNA設計原則的一個例子為:在所述人呼吸道病毒的所述全基因序列的保守區(qū)的基因啟動子后50-100個堿基開始,尋找基因序列中符合下列條件的19-21bp(例如19bp)核苷酸序列:(1)以G或C起始,以A或T結(jié)尾;(2)末端最后7個堿基至少有5個是A或T ;(3)避免4個連續(xù)的堿基,如AAAA或CCCC,從而增加堿基的復雜度;和/或(4) GC含量為30-52%之間。
[0057]優(yōu)秀地,可以分別使用不同的已知公共或商業(yè)siRNA設計工具,并分別得到各自的第一候選siRNA序列及其排序的結(jié)果,這些序列及其排序結(jié)果可以相同或不同,將這些結(jié)果進行比較并選取綜合評分較高的那些第一候選siRNA序列。
[0058]在本發(fā)明方法中,以所述人呼吸道病毒的所述全基因序列為模板,設計得到的第一候選siRNA序列的數(shù)目N至少為2條,可以為50-150條,甚至更多。本領域技術人員能夠理解的是,基于不同長度的人呼吸道病毒的基因序列,得到的第一候選siRNA序列的數(shù)目不同。例如,對于長度約為1.5kbp的人呼吸道病毒的基因序列,能夠得到約至少50條第一候選siRNA序列。
[0059]優(yōu)選地,在進行所述步驟3)之前,將由所述步驟2)得到的所述第一候選siRNA序列按其種子區(qū)與祀序列形成的雙螺旋熱力學穩(wěn)定性(seed duplex stability)進行排序,然后將其中穩(wěn)定性最高的M條第一候選siRNA序列進行所述步驟3),其中MS I。雙螺旋熱力學穩(wěn)定性(seed duplex stability)與雙螺旋的熔融溫度(Tm)對應,因此也可將由所述步驟2)得到的所述第一候選siRNA序列按其種子區(qū)與靶序列形成的雙螺旋的熔融溫度(Tm)進行排序,選擇Tm低于21.5°C或更低的M條第一候選siRNA序列進行所述步驟3),其中M彡I。雙螺旋熱力學穩(wěn)定性或雙螺旋的熔融溫度可按參考文獻“U1-Tei K, Naito Y, NishiK,Juni A, Saigo K.(2008).Thermodynamic stability and Watson-Crick base pairingin the seed duplex are major determinants of the efficiency of the siRNA—basedoff-target effect.Nucleic Acids Res.36,7100-7109.” 中所述的方法得到。
[0060]在本發(fā)明方法中,步驟3)中,所述比對分析包括序列同源性比對、序列功能域分析和結(jié)構(gòu)分析??梢酝ㄟ^對公共數(shù)據(jù)(包括涉及脫靶效應的序列同源性、序列功能域和結(jié)構(gòu)方面的數(shù)據(jù))的整合來建立比對分析數(shù)據(jù)庫和模型,以進行該比對分析。由此得到的比對分析結(jié)果可以通過建立另一獨立的比對分析數(shù)據(jù)庫和模型來進行驗證。
[0061]序列同源性比對包括:以人類基因組序列為模板,將第一候選SiRNA序列所針對的靶位點同人類基因組序列進行同源性比對,得到第二 siRNA序列,其中該第二 siRNA序列所針對的靶位點與所述人類基因組序列有I個以上堿基不匹配。優(yōu)選地,排除同人類基因組序列具有較高序列同源性(例如16個以上堿基)的序列,以確保第一候選siRNA序列所針對的靶位點不會對人類基因發(fā)生沉默或抑制作用,而僅對人呼吸道病毒基因具有特異的沉默或抑制作用。優(yōu)選地,所得到的第二 siRNA序列所針對的靶位點與所述人類基因組序列有2個以上、3個以上或更多個以上堿基不匹配。
[0062]序列功能域分析包括:將第一候選SiRNA序列所針對的靶位點進行序列同源性比對,把涉及人類基因組中特定功能基因(例如其表達變化能夠顯著造成對人體的毒副作用的功能基因)的那些排除。
[0063]結(jié)構(gòu)分析包括:將第一候選siRNA序列的二級結(jié)構(gòu)和人類基因的mRNA的二級結(jié)構(gòu)進行分析,把那些能夠由于二級結(jié)構(gòu)之間的相互作用產(chǎn)生脫靶效應的第一候選siRNA序列排除。
[0064]優(yōu)選地,在所述步驟3)中,對所得到的第二 siRNA序列進行進一步選擇,使得該第二 siRNA序列所針對的靶位點與所述人類基因組序列的堿基匹配數(shù)最低,并且/或者使得該第二 siRNA序列的種子區(qū)與所述人類基因組序列的3’端非編碼區(qū)有I個以上堿基不匹配。優(yōu)選地,該第二 siRNA序列的種子區(qū)與所述人類基因組序列的3’端非編碼區(qū)有2個以上、3個以上或更多個以上堿基不匹配。
[0065]優(yōu)選地,本發(fā)明方法還包括:4)將步驟3)得到的第二 siRNA序列的3’末端加上2個脫氧胸腺嘧啶核苷酸,得到第三siRNA序列的正義鏈,并且在該第二 siRNA序列的互補序列的3’末端加上2個脫氧胸腺嘧啶核苷酸,得到該第三siRNA序列的反義鏈。
[0066]優(yōu)選地,在本發(fā)明方法中,所述的人呼吸道病毒包括流感病毒、副流感病毒、呼吸道合胞病毒、麻疫病毒、腿腺炎病毒、腺病毒、風疫病毒、鼻病毒、冠狀病毒和/或呼腸病毒;更優(yōu)選為流感病毒;進一步優(yōu)選為甲型流感病毒;還進一步優(yōu)選為H1、H3、H5、H7或H9甲型流感病毒;還進一步優(yōu)選為H1N1、H3N2、H5N1、H7N7、H7N9甲型流感病毒。
[0067](二)根據(jù)本發(fā)明方法得到的siRNA
[0068]本發(fā)明另一個方面提供了由本發(fā)明方法得到的siRNA。
[0069]基于生物信息學篩選siRNA的方法得到的本發(fā)明的siRNA可以采用本領域的常規(guī)方法進行制備,包括(例如):化學合成、體外轉(zhuǎn)錄、siRNA表達載體、siRNA框架等。
[0070]優(yōu)選地,所述siRNA具有化學修飾,以增加siRNA的穩(wěn)定性,同時有效抑制靶基因的表達、并且降低或阻止SiRNAs免疫活性。優(yōu)選地,所述化學修飾可包括:磷酸骨架修飾、核糖修飾和/或堿基修飾。所述化學修飾的具體選擇可為本領域已知的那些,例如參考文獻“孫莉萍等,‘siRNA的化學修飾和臨床應用’,《生命的化學》2005年第25卷第4期”中所述的那些。
[0071]由于通過本發(fā)明方法得到的siRNA對人呼吸道病毒的特異性抑制作用強,而對人體的由于脫靶效應產(chǎn)生的毒副作用低,因此在應對新突發(fā)性呼吸道病毒疫情時,由該小核酸制成的藥物在進行生物學試驗和臨床試驗驗證藥效前,就可通過藥物的快速審批通道快速上市。這樣能夠針對突發(fā)性呼吸道病毒疫情進行快速反應,避免重大疫情的蔓延。當然,由本發(fā)明方法得到的siRNA的效果也可通過已知的方法進行驗證。
[0072](三)藥物組合物
[0073]本發(fā)明的又一個方面提供了一種藥物組合物,其包含作為活性成分的本發(fā)明siRNA以及藥用輔料。
[0074]優(yōu)選地,本發(fā)明的藥物組合物中含有一種以上本發(fā)明siRNA,例如可為多種siRNA構(gòu)成的多siRNA庫,以通過siRNA間競爭進一步抑制脫靶效應。
[0075]優(yōu)選地,所述藥物組合物被制成為噴霧劑??梢詫iRNA用脂質(zhì)體包裹,通過脂質(zhì)體介導來進入細胞,以提高siRNA的生物利用率。
[0076](四)制藥用途
[0077]本發(fā)明的又一個方面提供了本發(fā)明SiRNA在制備用于預防和/或治療人呼吸道病毒感染的疾病的藥物中的用途。
[0078](五)用于基于生物信息學篩選siRNA的裝置
[0079]本發(fā)明的又一個方面提供了一種用于基于生物信息學篩選siRNA的裝置,其中,通過該裝置得到的siRNA能夠沉默或抑制人呼吸道病毒基因,而不沉默或抑制人類基因;
[0080]其中,所述裝置包括:
[0081]I)第一單元,該第一單元用于提供所述人呼吸道病毒的全基因序列;優(yōu)選地,該第一單元可以為檢測單元和/或數(shù)據(jù)分析單元;
[0082]2)第二單元,該第二單元用于以所述人呼吸道病毒的所述全基因序列為模板,設計N條第一候選siRNA序列,使得所述第一候選siRNA序列能夠沉默或抑制所述人呼吸道病毒基因,其中N ^ 2 ;優(yōu)選地,該第二單元可以為數(shù)據(jù)分析單元;
[0083]3)第三單元,該第三單元用于通過比對分析來排除對人類基因能夠產(chǎn)生脫靶效應的第一候選siRNA序列,得到第二 siRNA序列,并且該第二 siRNA不沉默或抑制人類基因;優(yōu)選地,該第三單元可以為數(shù)據(jù)分析單元。
[0084]優(yōu)選地,所述裝置還包括:4)第四單元,該第四單元用于將第三單元得到的第二siRNA序列的3’末端加上2個脫氧胸腺嘧啶核苷酸,得到第三siRNA序列的正義鏈,并且在該第二 siRNA序列的互補序列的3’末端加上2個脫氧胸腺嘧啶核苷酸,得到該第三siRNA序列的反義鏈。優(yōu)選地,該第四單元可以為數(shù)據(jù)分析單元。
[0085]以下通過實施例的方式進一步解釋或說明本
【發(fā)明內(nèi)容】
,但這些實施例不應被理解為對本發(fā)明保護范圍的限制。
[0086]實施例1
[0087]從NCBI (美國國立生物技術信息中心,網(wǎng)址:www.ncb1.nlm.nih.gov)獲得一種H7N9甲型流感病毒基因組HA蛋白的cRNA序列(GeneBank登記號為:KC853766.1),長度1689bp0
[0088]以該cRNA序列為模板,使用siDirect在線設計工具,設計第一候選siRNA序列。具體而言,將該cRNA序列輸入siDirect在線設計工具(網(wǎng)址:http://sidirect2.rna1.jp/),得到67條第一候選siRNA序列。
[0089]將所得到的第一候選siRNA序列按其種子區(qū)與靶序列形成的雙螺旋熱力學穩(wěn)定性(seed duplex stability)進行排序,得到其中穩(wěn)定性最高(Tm值< 10°C)的第一候選siRNA序列,其對應的靶位點序列共4條:
[0090]序列1:5,-ACCAAAGTAAACACATTAACTGA-3’
[0091]序列2:5’ -TAGAATTTTCAGCCGATTTAATT-3’
[0092]序列3:5,-ATCAAATAACAGGAAAATTAAAC-3,
[0093]序列4:5,-GTCTTCATATGTGTAAAGAATGG-3,
[0094]通過比對分析來排除對人類基因能夠產(chǎn)生脫靶效應的第一候選siRNA序列,篩選得到第二 siRNA序列,其中該第二 siRNA序列所針對的靶位點與所述人類基因組序列均有2個以上堿基不匹配。并且,該第二 siRNA序列的種子區(qū)與所述人類基因組序列的3’端非編碼區(qū)均有2個以上堿基不匹配。
[0095]將得到的第二 siRNA序列的3’末端加上2個脫氧胸腺嘧啶核苷酸,得到第三siRNA序列的正義鏈,并且在該第二 siRNA序列的互補序列的3’末端加上2個脫氧胸腺嘧啶核苷酸,得到該第三siRNA序列的反義鏈。例如由序列I得到的第三siRNA序列的正義鏈和反義鏈為:
[0096]正義鏈5’ -AGUUAAUGUGUUUACUUUGdtdt-3’ ;
[0097]反義鏈5 ’ -CAAAGUAAACACAUUAACUdtdt-3 ’。
[0098]由此得到的siRNA經(jīng)生物學實驗驗證能夠沉默或抑制人呼吸道病毒基因,而不沉默或抑制人類基因。
[0099]實施例2
[0100]從NCBI (美國國立生物技術信息中心,網(wǎng)址:www.ncb1.nlm.nih.gov/)獲得一種H7N9甲型流感病毒基因組HA蛋白的cRNA序列(GeneBank登記號為:KC853766.1),長度1689bp。
[0101]以該cRNA序列為模板,分別使用siDirect、Dharmacon> GenScript在線設計工具,設計第一候選siRNA序列。具體而言,將該cRNA序列輸入(I) siDirect在線設計工具(網(wǎng)址:http://sidirect2.rna1.jp/)、(2) Dharmacon 在線設計工具(網(wǎng)址:http://www.thermoscientificb1.com/design-center/?redirect=true)和(3) GenScript 在線設計工具(網(wǎng)址:https://www.genscript.com/ssl-bin/app/rnai),分別得到各自的第一候選siRNA序列及其排序的結(jié)果,將這些結(jié)果進行比較并選取綜合評分較高的那些第一候選siRNA序列。
[0102]通過比對分析來排除對人類基因能夠產(chǎn)生脫靶效應的第一候選siRNA序列,得到第二 siRNA序列,其中該第二 siRNA序列所針對的靶位點與所述人類基因組序列均有2個以上堿基不匹配。并且,該第二 siRNA序列的種子區(qū)與所述人類基因組序列的3’端非編碼區(qū)均有2個以上堿基不匹配。
[0103]將得到的第二 siRNA序列的3’末端加上2個脫氧胸腺嘧啶核苷酸,得到第三siRNA序列的正義鏈,并且在該第二 siRNA序列的互補序列的3’末端加上2個脫氧胸腺嘧啶核苷酸,得到該第三siRNA序列的反義鏈。
[0104]由此得到的siRNA經(jīng)生物學實驗驗證能夠沉默或抑制人呼吸道病毒基因,而不沉默或抑制人類基因。
【權利要求】
1.一種基于生物信息學篩選811^八的方法,其中,通過該方法得到的811^八能夠沉默或抑制人呼吸道病毒基因,而不沉默或抑制人類基因; 其中,所述方法包括: 1)提供所述人呼吸道病毒的全基因序列; 2)以所述人呼吸道病毒的所述全基因序列為模板,設計~條第一候選811^八序列,使得所述第一候選811^八序列能夠沉默或抑制所述人呼吸道病毒基因,其中~ ^ 2 ;并且 3)通過比對分析來排除對人類基因能夠產(chǎn)生脫靶效應的第一候選811^八序列,得到第二 序列,該第二 811^4不沉默或抑制人類基因。
2.根據(jù)權利要求1所述的方法,其中,在進行所述步驟3)之前,將由所述步驟2)得到的所述第一候選81陬八序列按其種子區(qū)與靶序列形成的雙螺旋熱力學穩(wěn)定性(866(1 (1^16^
進行排序,然后將其中穩(wěn)定性最高的1條第一候選八序列進行所述步驟3),其中1彡1。
3.根據(jù)權利要求1所述的方法,其中在所述步驟3)中,該第二811^八序列所針對的靶位點與所述人類基因組序列有1個以上堿基不匹配; 優(yōu)選地,對所得到的第二 811^八序列進行進一步選擇,使得該第二 811^八序列所針對的靶位點與所述人類基因組序列的堿基匹配數(shù)最低,并且/或者使得該第二 811^八序列的種子區(qū)與所述人類基因組序列的3’端非編碼區(qū)有1個以上堿基不匹配。
4.根據(jù)權利要求1-3中任意一項所述的方法,其中所述方法還包括: 4)將步驟3)得到的第二811^八序列的3’末端加上2個脫氧胸腺嘧啶核苷酸,得到第三811^八序列的正義鏈,并且在該第二 811^八序列的互補序列的3’末端加上2個脫氧胸腺嘧啶核苷酸,得到該第三811^八序列的反義鏈。
5.根據(jù)權利要求1所述的方法,其中所述人呼吸道病毒包括流感病毒、副流感病毒、呼吸道合胞病毒、麻疫病毒、腿腺炎病毒、腺病毒、風疫病毒、鼻病毒、冠狀病毒和/或呼腸病毒;優(yōu)選為流感病毒;更優(yōu)選為甲型流感病毒;進一步優(yōu)選為或!19甲型流感病毒。
6.一種根據(jù)權利要求1-5中任意一項所述的方法得到的811^八。
7.根據(jù)權利要求6所述的811^4,其中所述具有化學修飾,并且所述化學修飾包括:磷酸骨架修飾、核糖修飾和/或堿基修飾。
8.一種藥物組合物,其包含作為活性成分的權利要求6或7所述的以及藥用輔料;優(yōu)選地,所述藥物組合物被制成為噴霧劑。
9.根據(jù)權利要求6或7所述的在制備用于預防和/或治療人呼吸道病毒感染的疾病的藥物中的用途。
10.一種用于基于生物信息學篩選811^八的裝置,其中,通過該裝置得到的811^八能夠沉默或抑制人呼吸道病毒基因,而不沉默或抑制人類基因; 其中,所述裝置包括: 1)第一單元,該第一單元用于提供所述人呼吸道病毒的全基因序列; 2)第二單元,該第二單元用于以所述人呼吸道病毒的所述全基因序列為模板,設計~條第一候選811^八序列,使得所述第一候選811^八序列能夠沉默或抑制所述人呼吸道病毒基因,其中?彡2;以及 3)第三單元,該第三單元用于通過比對分析來排除對人類基因能夠產(chǎn)生脫靶效應的第一候選811^4序列,得到第二 811^4序列,該第二 811^4不沉默或抑制人類基因。
【文檔編號】C12N15/113GK104419702SQ201310398025
【公開日】2015年3月18日 申請日期:2013年9月4日 優(yōu)先權日:2013年9月4日
【發(fā)明者】胡放, 趙榮華, 張慶勇, 李樹龍, 孫言偉 申請人:北京中康萬達醫(yī)藥科技有限公司