本公開涉及耗竭探針。
背景技術(shù):
1、轉(zhuǎn)錄組是指細(xì)胞或生物體在給定時(shí)間的rna轉(zhuǎn)錄物。轉(zhuǎn)錄組的知識揭示了活躍的細(xì)胞過程,并且可以提供關(guān)于細(xì)胞調(diào)節(jié)、生長和功能障礙的信息。
2、轉(zhuǎn)錄組分析通常涉及微陣列技術(shù),并且更常見地涉及下一代測序技術(shù)(例如,rna-seq)。rna-seq的常見目標(biāo)是檢測存在的不同轉(zhuǎn)錄物中的所有轉(zhuǎn)錄物(包括mrna和非編碼rna),以及檢測剪接變體、突變、移動遺傳元件和在各種發(fā)育階段或在各種條件下的表達(dá)水平。轉(zhuǎn)錄組學(xué)和rna-seq應(yīng)用于診斷學(xué)、疾病分析、病原體檢測、進(jìn)化生物學(xué)和其它研究領(lǐng)域。例如,rna-seq可以潛在地識別與對環(huán)境壓力的抗性(如作物的抗旱性)相關(guān)的基因。在另一個(gè)實(shí)例中,轉(zhuǎn)錄組分析可以提供關(guān)于藥物抗性的機(jī)制的信息,從而潛在地揭示用于對抗醫(yī)院獲得性抗生素抗性感染的策略。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供了rna耗竭探針、即短dna寡核苷酸的組,所述短dna寡核苷酸沿著來自樣品中的將被耗竭的rna的長度雜交。dna寡核苷酸介導(dǎo)rnase?h對靶rna的消化。本發(fā)明可用于從樣品中去除非靶rna,以便促進(jìn)低豐度rna的捕獲或簡單地實(shí)現(xiàn)靶rna的更高產(chǎn)率。根據(jù)本發(fā)明的耗竭探針基于探針/靶標(biāo)相互作用的生物化學(xué)和生物物理特性進(jìn)行設(shè)計(jì),以使得一組耗竭探針中的所有耗竭探針表現(xiàn)出均勻、一致的行為。例如,耗竭探針可以被設(shè)計(jì)成具有在窄的、預(yù)定義的范圍內(nèi)的熔解(melting?temperature)溫度(tm)。本發(fā)明的探針被設(shè)計(jì)成實(shí)現(xiàn)改善的性能,從而通常產(chǎn)生具有沿著來自樣品中的將被去除的rna的不規(guī)則、甚至明顯隨機(jī)的間距的探針組。
2、不受不規(guī)則間距的影響,由于合理的基于生物學(xué)的設(shè)計(jì)(所述設(shè)計(jì)對tm進(jìn)行建模并且篩選參考rna序列數(shù)據(jù)以省略具有脫靶匹配的候選探針序列),本發(fā)明的探針組優(yōu)于現(xiàn)有技術(shù)的探針組?,F(xiàn)有技術(shù)的探針組犧牲了完全缺失,以便實(shí)現(xiàn)沿著要去除的rna的均勻探針結(jié)合。由于探針組必須以均勻間距和熔解溫度沿著rna的長度平鋪的限制性假設(shè),許多探針由于如gc含量、二級結(jié)構(gòu)或長度等因素而結(jié)合不良。本發(fā)明通過使用在選擇的熔解溫度窗口內(nèi)工作并減少脫靶結(jié)合的設(shè)計(jì)方法來解決這些問題。
3、本發(fā)明的探針沿著一個(gè)或多個(gè)rna分子以不可預(yù)測的、明顯隨機(jī)的間距形成異源雙鏈體(heteroduplex)。事實(shí)上,本發(fā)明的探針組可能留下長的rna間隙——在一些情況下,間隙高達(dá)超過約100個(gè)堿基——但仍優(yōu)于現(xiàn)有技術(shù)的探針組,所述現(xiàn)有技術(shù)的探針組被設(shè)計(jì)成沿著靶rna遵循一些簡單的短、規(guī)則的間隙模式。另外,即使在高度分解的樣品中,本發(fā)明的探針也顯示出了改善的耗竭。根據(jù)本發(fā)明的探針設(shè)計(jì)的另一個(gè)優(yōu)點(diǎn)在于,其允許探針雜交和rna消化在單個(gè)、快速步驟中發(fā)生,而不是使用加熱/冷卻循環(huán),然后是漫長且次優(yōu)的消化溫度。因?yàn)楸景l(fā)明的探針組使用被設(shè)計(jì)成利用異源雙鏈體形成的實(shí)際序列內(nèi)容和生物物理特性的探針,因此使用本發(fā)明的探針組的rna耗竭可靠地從樣品中去除了過量的rna。因?yàn)榇祟惞ぞ呖梢杂糜诳煽康厝コ齬na,如核糖體rna和/或珠蛋白轉(zhuǎn)錄物,因此使用本發(fā)明的探針組的rna-seq測定更好地檢測剩余且有時(shí)罕見的mrna轉(zhuǎn)錄物。因?yàn)楹币姷倪z傳事件是如癌癥或病原性感染等關(guān)鍵條件的標(biāo)志物,因此本發(fā)明的探針組可用于早期且準(zhǔn)確地檢測關(guān)鍵生物信息。
4、在某些方面,本發(fā)明提供了用于耗竭rna的方法。優(yōu)選的方法包括將多個(gè)dna寡核苷酸與樣品中的靶rna分子雜交以形成異源雙鏈體,其中所述dna寡核苷酸具有被選擇以實(shí)現(xiàn)以下的序列:(i)使所述異源雙鏈體的熔解溫度在預(yù)定范圍內(nèi),以及(ii)使與參考脫靶rna的匹配最小化。本發(fā)明的方法進(jìn)一步包括消化所述異源雙鏈體中的rna。所述異源雙鏈體可以沿著所述rna分子以非均勻分布形成。所述dna寡核苷酸可以包括低gc寡核苷酸和熔解溫度高于所述低gc寡核苷酸的高gc寡核苷酸。所述dna寡核苷酸可以包括低gc寡核苷酸和比所述低gc寡核苷酸更短的高gc寡核苷酸。所述dna寡核苷酸可以被選擇以使相鄰異源雙鏈體之間的間距最小化,并且可以以非均勻的濃度存在。
5、在一些實(shí)施例中,dna寡核苷酸通過以下方式進(jìn)行選擇:生成一組與靶rna(在此情況下,是要去除的rna)互補(bǔ)的候選序列,其中預(yù)測的熔解溫度在預(yù)定范圍內(nèi);至少部分地基于與所述參考脫靶rna的匹配評分來為所述候選序列中的每個(gè)候選序列分配成本函數(shù)(cost?function);以及選擇一組映射到沿著rna分子的位置的候選序列,其中所述組是通過使累積成本函數(shù)、位置間間隙和/或重疊最小化的算法進(jìn)行選擇的。所述dna序列可以由計(jì)算機(jī)系統(tǒng)選擇以提供dna寡核苷酸,所述dna寡核苷酸各自以類似的退火溫度、以最小或沒有重疊并且以最小或沒有退火脫靶rna來唯一地退火rna分子。任選地,計(jì)算機(jī)系統(tǒng)進(jìn)一步選擇序列,以提供具有最小長度的dna寡核苷酸和/或使異源雙鏈體之間的間隙最小化。
6、在一些實(shí)施例中,dna寡核苷酸被測試并且顯示出不與標(biāo)準(zhǔn)化人參考rna提取物中的蛋白質(zhì)編碼轉(zhuǎn)錄物穩(wěn)定雜交。靶rna分子可以包括核糖體rna、珠蛋白轉(zhuǎn)錄物或線粒體rna中的任何一種。優(yōu)選的方法包括進(jìn)行所述步驟以消化樣品中的核糖體rna和珠蛋白轉(zhuǎn)錄物。消化步驟可以包括用rnaseh處理所述樣品。另外,優(yōu)選的方法可以包括在消化步驟之后逆轉(zhuǎn)錄樣品中的非靶rna分子。在優(yōu)選的實(shí)施例中,異源雙鏈體在沿著rna分子的位置處形成,所述位置不形成任何規(guī)則、重復(fù)或均勻的模式或間距。例如,異源雙鏈體之間的間距可以是高度可變的和/數(shù)學(xué)上隨機(jī)的。異源雙鏈體的定位可以留下具有至少約10個(gè)至約100個(gè)堿基的rna分子的一個(gè)或多個(gè)未覆蓋區(qū)。此外,覆蓋不需要是端到端的,這意指5'和3'端序列可以是未覆蓋的。
7、本發(fā)明的方法可以增加樣品中poly-a尾rna(poly-a?tailed?rna)與非編碼rna的比率。dna寡核苷酸中的至少兩個(gè)dna寡核苷酸的序列被選擇以在彼此重疊或鄰接的位置處與要耗竭的rna雜交。本發(fā)明中使用的dna寡核苷酸的長度可以是約20個(gè)堿基至約40個(gè)堿基(例如,在介于18個(gè)與44個(gè)之間變化,包含端值)。所述dna寡核苷酸可以以非等摩爾濃度存在于混合物中。例如,基于經(jīng)驗(yàn)性觀察結(jié)果,探針中的一些探針的濃度可能得到增強(qiáng),例如翻倍。
8、本發(fā)明的方面提供了一組rna耗竭探針。示例性組包括與要耗竭的rna雜交以形成異源雙鏈體的多個(gè)dna寡核苷酸,其中所述dna寡核苷酸具有被選擇以實(shí)現(xiàn)以下的序列:(i)使所述異源雙鏈體的熔解溫度在預(yù)定范圍內(nèi),以及(ii)使與脫靶rna的匹配最小化。優(yōu)選地,所述異源雙鏈體沿著rna分子以非均勻分布形成。所述組中的異源雙鏈體之間的間距可以是高度可變的和/或數(shù)學(xué)上隨機(jī)的。所述dna寡核苷酸可以被選擇以使相鄰異源雙鏈體之間的間距最小化。所述dna寡核苷酸可以包括低gc寡核苷酸和高gc寡核苷酸兩者(所述高gc寡核苷酸的熔解溫度高于所述低gc寡核苷酸和/或比所述低gc寡核苷酸更短)。所述探針組可以通過以下方式進(jìn)行設(shè)計(jì):生成一組與rna分子互補(bǔ)的候選序列,其中預(yù)測的熔解溫度在預(yù)定范圍內(nèi);至少部分地基于與參考脫靶rna的匹配評分來為所述候選序列中的每個(gè)候選序列分配成本函數(shù);以及選擇一組映射到沿著rna分子的位置的候選序列,其中所述組是通過使累積成本函數(shù)、位置間間隙和/或重疊最小化的算法進(jìn)行選擇的。探針組可以被設(shè)計(jì)成耗竭核糖體rna、線粒體rna、珠蛋白轉(zhuǎn)錄物或其它中的任何一種。值得注意的是,異源雙鏈體可以在沿著rna分子的位置處形成,所述位置不形成任何規(guī)則、重復(fù)或均勻的模式或間距。