本發(fā)明涉及轉(zhuǎn)錄組文庫測序分析
技術(shù)領(lǐng)域:
,具體地涉及制備候選測序探針集的方法、裝置及其應(yīng)用。
背景技術(shù):
:目前,轉(zhuǎn)錄組建庫及測序領(lǐng)域可以基于短的雙末端配對的讀長序列進(jìn)行全轉(zhuǎn)錄組的信息分析,包括了可變剪接等遺傳表達(dá)事件的分析。然而,目前的轉(zhuǎn)錄組測序技術(shù),獲得的測序結(jié)果準(zhǔn)確性低,數(shù)據(jù)偏向性高,后續(xù)無法將較為復(fù)雜的遺傳信息進(jìn)行解碼注釋,轉(zhuǎn)錄本和可變剪切分析難。因而,目前的轉(zhuǎn)錄組測序技術(shù)仍有待改進(jìn)。技術(shù)實現(xiàn)要素:本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一。為此,本發(fā)明的一個目的在于提出一種測序結(jié)果準(zhǔn)確可靠、數(shù)據(jù)偏向性低,且能夠有效檢測獲得新的轉(zhuǎn)錄本和可變剪切形式的轉(zhuǎn)錄組測序技術(shù)。需要說明的是,本發(fā)明是基于發(fā)明人的下列發(fā)現(xiàn)而完成的:基因測序發(fā)展到第二代高通量測序技術(shù),在轉(zhuǎn)錄組建庫及測序領(lǐng)域可以基于短的雙末端配對的讀長序列進(jìn)行全轉(zhuǎn)錄組的信息分析,包括了可變剪接等遺傳表達(dá)事件的分析,而由于較短的讀長限制(50/90nt*2的堿基)使得轉(zhuǎn)錄組的分析無法將較為復(fù)雜的遺傳信息進(jìn)行解碼注釋。第三代單分子測序的技術(shù)達(dá)到幾十kb級別的讀長使得基因測序及后續(xù)分析軟件不再受到短序列讀長對數(shù)據(jù)分析的限制,然而第三代測序技術(shù)當(dāng)前由于測序準(zhǔn)確性只能達(dá)到85%的水平,從而使得該技術(shù)也無法快速應(yīng)用于轉(zhuǎn)錄組等領(lǐng)域的測序。同時當(dāng)前轉(zhuǎn)錄組建庫技術(shù)需要經(jīng)過核糖體去除、一鏈反轉(zhuǎn)錄、二鏈cdna合成、全長cdna打斷、標(biāo)準(zhǔn)dna建庫等繁瑣步驟,對總rna的起始量要求較高,且繁瑣的操作過程帶來了數(shù)據(jù)的偏向性。而發(fā)明人在實驗研究中發(fā)現(xiàn),通過對rna數(shù)據(jù)的分析選擇合適的測序引物組,通過不同的毗鄰測序引物組進(jìn)行幾乎全長的rna測序,進(jìn)而通過測序得到的短讀長進(jìn)行連續(xù)較長讀長的組合,能夠更好地實現(xiàn)轉(zhuǎn)錄組測序,測序結(jié)果及確定的轉(zhuǎn)錄本序列準(zhǔn)確可靠、數(shù)據(jù)偏向性低,有利于后續(xù)的轉(zhuǎn)錄本和可變剪切分析,且能夠有效檢測獲得新的新的轉(zhuǎn)錄本和可變剪切形式。在本發(fā)明的第一方面,本發(fā)明提供了一種制備候選測序探針集的方法。根據(jù)本發(fā)明的實施例,該方法包括以下步驟:(1)基于參考基因組的目標(biāo)mrna序列,以20bp為窗口,10bp為步長設(shè)計探針,構(gòu)建候選探針集合;(2)將所述候選探針集合中的所有候選探針與所述參考基因組的目標(biāo)mrna序列進(jìn)行比對,以便獲得比對結(jié)果;(3)基于所述比對結(jié)果,對所述候選探針集合中的所有候選探針進(jìn)行篩選,以便得到特異性探針集,其中所述篩選包括:去除比對到除自身以外的mrna的位置且連續(xù)比對上的長度大于10bp且錯配小于等于2的候選探針;(4)針對所述參考基因組目標(biāo)mrna中的高度同源基因,按照步驟(1)的方法設(shè)計得到相同的探針,以便得到針對高度同源基因的探針;(5)合并所述特異性探針集和所述針對高度同源基因的探針,以便獲得所述候選測序探針集。發(fā)明人發(fā)現(xiàn),利用本發(fā)明的制備候選測序探針集的方法,能夠有效地獲得針對參考基因組的目標(biāo)mrna(甚至全部mrna)的候選測序探針集,進(jìn)而,基于對該候選測序探針集的進(jìn)一步篩選能夠有效制備獲得針對參考基因組轉(zhuǎn)錄組文庫目標(biāo)mrna的特異性測序引物組,利用該特異性測序引物組進(jìn)行測序得到的短讀長進(jìn)行連續(xù)較長讀長的組合,能夠更好地實現(xiàn)轉(zhuǎn)錄組測序,且測序結(jié)果及確定的轉(zhuǎn)錄本序列準(zhǔn)確可靠、數(shù)據(jù)偏向性低,有利于后續(xù)的轉(zhuǎn)錄本和可變剪切分析,且能夠有效檢測獲得新的轉(zhuǎn)錄本和可變剪切形式。在本發(fā)明的第二方面,本發(fā)明提供了一種制備參考基因組目標(biāo)mrna特異性的測序引物組的方法。根據(jù)本發(fā)明的實施例,該方法包括以下步驟:根據(jù)前面所述的制備候選測序探針集的方法,制備待測樣品的測序探針集;針對所述參考基因組目標(biāo)mrna中的每一個mrna,均單獨按照待測樣品基因組轉(zhuǎn)錄組文庫的插入片段長度x進(jìn)行區(qū)域劃分,每一個插入片段長度大小的區(qū)域作為一組,剩余不足插入片段長度大小的區(qū)域也視為一組,以便將所述參考基因組的目標(biāo)mrna分為m組,且基于各組在所述參考基因組上的位置順序,將各組依次命名為第1組、第2組……第m組;基于所述轉(zhuǎn)錄組文庫的插入片段長度x和測序讀長y,確定每一組設(shè)置的測序探針數(shù)目n,其中n≈x/y;基于所述待測樣品的候選測序探針集,在每一組均優(yōu)選出n個最優(yōu)探針作為測序探針,其中每一組的所述n個測序探針在參考基因組上的位置相鄰,且依據(jù)各測序探針在參考基因組上的位置順序,分別將每一組的測序探針以“組號-組中探針順序號”進(jìn)行命名,其中,第m組的測序探針依次為m-1、m-2……m-n;分別合并各組中探針順序號相同的測序探針,以便獲得n個參考基因組目標(biāo)mrna特異性的測序引物組,其中,第n組測序引物組中的測序探針為1-n、2-n……m-n。發(fā)明人驚奇地發(fā)現(xiàn),利用本發(fā)明的制備測序引物組的方法,能夠有效制備獲得針對參考基因組轉(zhuǎn)錄組文庫目標(biāo)mrna的特異性測序引物組,進(jìn)而利用該特異性測序引物組進(jìn)行測序得到的短讀長進(jìn)行連續(xù)較長讀長的組合,能夠更好地實現(xiàn)轉(zhuǎn)錄組測序,且測序結(jié)果及確定的轉(zhuǎn)錄本序列準(zhǔn)確可靠、數(shù)據(jù)偏向性低,有利于后續(xù)的轉(zhuǎn)錄本和可變剪切分析,且能夠有效檢測獲得新的轉(zhuǎn)錄本和可變剪切形式。其中,當(dāng)所述分組基于參考基因組的全部mrna進(jìn)行時,利用上述方法能夠有效制備針對整個參考基因組的測序引物組。在本發(fā)明的第三方面,本發(fā)明提供了一種確定待測樣品轉(zhuǎn)錄組文庫的目標(biāo)mrna序列的方法。根據(jù)本發(fā)明的實施例,該方法包括以下步驟:提供待測樣品的基因組轉(zhuǎn)錄組文庫,所述基因組轉(zhuǎn)錄組文庫的插入片段長度為x;根據(jù)前面所述的制備測序引物組的方法,制備獲得n個參考基因組目標(biāo)mrna特異性的測序引物組;利用所述n個參考基因組目標(biāo)mrna特異性的測序引物組對所述待測樣品的基因組轉(zhuǎn)錄組文庫進(jìn)行梯度測序,以便獲得n組測序結(jié)果,其中,所述梯度測序包括n個測序循環(huán),依次利用第1組至第n組測序引物組進(jìn)行測序;以及基于每個測序引物組的測序探針的序列以及相應(yīng)的測序結(jié)果,確定所述待測樣品的基因組轉(zhuǎn)錄組文庫的目標(biāo)mrna序列。根據(jù)本發(fā)明的實施例,利用本發(fā)明的確定待測樣品轉(zhuǎn)錄組文庫序列的方法,利用獲得的特異性測序引物組對待測樣品的基因組轉(zhuǎn)錄組文庫進(jìn)行梯度測序,測序結(jié)果及確定的轉(zhuǎn)錄本序列準(zhǔn)確可靠、數(shù)據(jù)偏向性低,并且基于測序得到的短讀長能夠有效進(jìn)行連續(xù)較長讀長的組合,從而有利于后續(xù)的轉(zhuǎn)錄本和可變剪切分析,且能夠有效檢測獲得新的轉(zhuǎn)錄本和可變剪切形式。當(dāng)所述n個參考基因組目標(biāo)mrna特異性的測序引物組具有針對整個參考基因組的特異性時,利用上述方法能夠有效確定待測樣品的整個轉(zhuǎn)錄組文庫的序列。在本發(fā)明的第四方面,本發(fā)明提供了一種候選測序探針集制備裝置。根據(jù)本發(fā)明的實施例,該裝置包括:候選探針集合構(gòu)建單元,所述候選探針集合構(gòu)建單元用于基于參考基因組的目標(biāo)mrna序列,以20bp為窗口,10bp為步長設(shè)計探針,構(gòu)建候選探針集合;比對單元,所述比對單元與所述候選探針集合構(gòu)建單元相連,用于將所述候選探針集合中的所有候選探針與所述參考基因組的目標(biāo)mrna序列進(jìn)行比對,以便獲得比對結(jié)果;候選探針篩選單元,所述候選探針篩選單元與所述比對單元相連,用于基于所述比對結(jié)果,對所述候選探針集合中的所有候選探針進(jìn)行篩選,以便得到特異性探針集,其中,所述候選探針篩選單元適于按照以下條件進(jìn)行所述篩選:去除比對到除自身以外的mrna的位置且連續(xù)比對上的長度大于10bp且錯配小于等于2的候選探針;高度同源基因探針制備單元,所述高度同源基因探針制備單元用于針對所述參考基因組目標(biāo)mrna中的高度同源基因,以20bp為窗口,10bp為步長設(shè)計得到相同的探針,以便得到針對高度同源基因的探針;以及合并單元,所述合并單元分別與所述高度同源基因探針制備單元和所述候選探針篩選單元相連,用于合并所述特異性探針集和所述針對高度同源基因的探針,以便獲得所述候選測序探針集。發(fā)明人發(fā)現(xiàn),利用本發(fā)明的候選測序探針集制備裝置能夠有效地制備獲得針對參考基因組目標(biāo)mrna的候選測序探針集,進(jìn)而,基于對該候選測序探針集的進(jìn)一步篩選能夠有效制備獲得針對參考基因組轉(zhuǎn)錄組文庫目標(biāo)mrna的特異性測序引物組,利用該特異性測序引物組進(jìn)行測序得到的短讀長進(jìn)行連續(xù)較長讀長的組合,能夠更好地實現(xiàn)轉(zhuǎn)錄組測序,且測序結(jié)果及確定的轉(zhuǎn)錄本序列準(zhǔn)確可靠、數(shù)據(jù)偏向性低,有利于后續(xù)的轉(zhuǎn)錄本和可變剪切分析,且能夠有效檢測獲得新的轉(zhuǎn)錄本和可變剪切形式。在本發(fā)明的第五方面,本發(fā)明提供了一種測序引物組制備設(shè)備。根據(jù)本發(fā)明的實施例,該設(shè)備包括:前面所述的候選測序探針集制備裝置,所述候選測序探針集制備裝置用于制備待測樣品的測序探針集;mrna分組裝置,所述mrna分組裝置用于針對所述參考基因組目標(biāo)mrna中的每一個mrna,均單獨按照待測樣品基因組轉(zhuǎn)錄組文庫的插入片段長度x進(jìn)行區(qū)域劃分,每一個插入片段長度大小的區(qū)域作為一組,剩余不足插入片段長度大小的區(qū)域也視為一組,以便將所述參考基因組的目標(biāo)mrna分為m組,且基于各組在所述參考基因組上的位置順序,將各組依次命名為第1組、第2組……第m組;測序探針數(shù)目確定裝置,所述測序探針數(shù)目確定裝置用于基于所述轉(zhuǎn)錄組文庫的插入片段長度x和測序讀長y,確定每一組設(shè)置的測序探針數(shù)目n,其中n≈x/y;測序探針序列確定及命名裝置,所述測序探針序列確定及命名裝置分別與所述候選測序探針集制備裝置、所述mrna分組裝置和所述測序探針數(shù)目確定裝置相連,用于基于所述待測樣品的候選測序探針集,在每一組均優(yōu)選出n個最優(yōu)探針作為測序探針,其中每一組的所述n個測序探針在參考基因組上的位置相鄰,且依據(jù)各測序探針在參考基因組上的位置順序,分別將每一組的測序探針以“組號-組中探針順序號”進(jìn)行命名,其中,第m組的測序探針依次為m-1、m-2……m-n;以及測序引物組確定裝置,所述測序引物組確定裝置與所述測序探針序列確定及命名裝置相連,用于分別合并各組中探針順序號相同的測序探針,以便獲得n個參考基因組目標(biāo)mrna特異性的測序引物組,其中,第n組測序引物組中的測序探針為1-n、2-n……m-n。發(fā)明人驚奇地發(fā)現(xiàn),利用本發(fā)明的測序引物組制備設(shè)備能夠有效制備獲得針對參考基因組轉(zhuǎn)錄組文庫目標(biāo)mrna的特異性測序引物組,進(jìn)而利用該特異性測序引物組進(jìn)行測序得到的短讀長進(jìn)行連續(xù)較長讀長的組合,能夠更好地實現(xiàn)轉(zhuǎn)錄組測序,且測序結(jié)果及確定的轉(zhuǎn)錄本序列準(zhǔn)確可靠、數(shù)據(jù)偏向性低,有利于后續(xù)的轉(zhuǎn)錄本和可變剪切分析,且能夠有效檢測獲得新的轉(zhuǎn)錄本和可變剪切形式。其中,當(dāng)所述分組基于參考基因組的全部mrna進(jìn)行時,利用上述設(shè)備能夠有效制備針對整個參考基因組的測序引物組。在本發(fā)明的第六方面,本發(fā)明提供了一種用于確定待測樣品轉(zhuǎn)錄組文庫的目標(biāo)mrna序列的系統(tǒng)。根據(jù)本發(fā)明的實施例,該系統(tǒng)包括:轉(zhuǎn)錄組文庫提供設(shè)備,所述轉(zhuǎn)錄組文庫提供設(shè)備用于提供待測樣品的基因組轉(zhuǎn)錄組文庫,所述基因組轉(zhuǎn)錄組文庫的插入片段長度為x;前面所述的測序引物組制備設(shè)備,所述測序引物組制備設(shè)備用于制備獲得n個參考基因組目標(biāo)mrna特異性的測序引物組;測序設(shè)備,所述測序設(shè)備分別與所述轉(zhuǎn)錄組文庫提供設(shè)備和所述測序引物組制備設(shè)備相連,用于利用所述n個參考基因組目標(biāo)mrna特異性的測序引物組對所述待測樣品的基因組轉(zhuǎn)錄組文庫進(jìn)行梯度測序,以便獲得n組測序結(jié)果,其中,所述梯度測序包括n個測序循環(huán),依次利用第1組至第n組測序引物組進(jìn)行測序;以及文庫序列確定設(shè)備,所述文庫序列確定設(shè)備與所述測序設(shè)備相連,用于基于每個測序引物組的測序探針的序列以及相應(yīng)的測序結(jié)果,確定所述待測樣品的基因組轉(zhuǎn)錄組文庫的目標(biāo)mrna的序列。根據(jù)本發(fā)明的實施例,本發(fā)明的用于確定待測樣品轉(zhuǎn)錄組文庫的目標(biāo)mrna序列的系統(tǒng),能夠利用獲得的特異性測序引物組對待測樣品的基因組轉(zhuǎn)錄組文庫進(jìn)行梯度測序,測序結(jié)果及確定的轉(zhuǎn)錄本序列準(zhǔn)確可靠、數(shù)據(jù)偏向性低,并且基于測序得到的短讀長能夠有效進(jìn)行連續(xù)較長讀長的組合,從而有利于后續(xù)的轉(zhuǎn)錄本和可變剪切分析,且能夠有效檢測獲得新的轉(zhuǎn)錄本和可變剪切形式。當(dāng)所述n個參考基因組目標(biāo)mrna特異性的測序引物組具有針對整個參考基因組的特異性時,利用上述系統(tǒng)能夠有效確定待測樣品的整個轉(zhuǎn)錄組文庫的序列。本發(fā)明的附加方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。附圖說明本發(fā)明的上述和/或附加的方面和優(yōu)點從結(jié)合下面附圖對實施例的描述中將變得明顯和容易理解,其中:圖1顯示了根據(jù)本發(fā)明一個實施例的候選測序探針集制備裝置的結(jié)構(gòu)示意圖;圖2顯示了根據(jù)本發(fā)明一個實施例的測序引物組制備設(shè)備的結(jié)構(gòu)示意圖;圖3顯示了根據(jù)本發(fā)明一個實施例的用于確定待測樣品轉(zhuǎn)錄組文庫的目標(biāo)mrna序列的系統(tǒng)的結(jié)構(gòu)示意圖;圖4顯示了根據(jù)本發(fā)明一個實施例,轉(zhuǎn)錄組rna全長測序探針設(shè)計示意圖;以及圖5顯示了根據(jù)本發(fā)明一個實施例,梯度引物組測序方法的流程示意圖。具體實施方式下面詳細(xì)描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。制備候選測序探針集的方法及其應(yīng)用在本發(fā)明的第一方面,本發(fā)明提供了一種制備候選測序探針集的方法。根據(jù)本發(fā)明的實施例,該方法包括以下步驟:(1)基于參考基因組的目標(biāo)mrna序列,以20bp為窗口,10bp為步長設(shè)計探針,構(gòu)建候選探針集合;(2)將所述候選探針集合中的所有候選探針與所述參考基因組的目標(biāo)mrna序列進(jìn)行比對,以便獲得比對結(jié)果;(3)基于所述比對結(jié)果,對所述候選探針集合中的所有候選探針進(jìn)行篩選,以便得到特異性探針集,其中所述篩選包括:去除比對到除自身以外的mrna的位置且連續(xù)比對上的長度大于10bp且錯配小于等于2的候選探針;(4)針對所述參考基因組目標(biāo)mrna中的高度同源基因,按照步驟(1)的方法設(shè)計得到相同的探針,以便得到針對高度同源基因的探針;(5)合并所述特異性探針集和所述針對高度同源基因的探針,以便獲得所述候選測序探針集。發(fā)明人發(fā)現(xiàn),利用本發(fā)明的制備候選測序探針集的方法,能夠有效地獲得針對參考基因組目標(biāo)mrna的候選測序探針集,進(jìn)而,基于對該候選測序探針集的進(jìn)一步篩選能夠有效制備獲得針對參考基因組轉(zhuǎn)錄組文庫目標(biāo)mrna的特異性測序引物組,利用該特異性測序引物組進(jìn)行測序得到的短讀長進(jìn)行連續(xù)較長讀長的組合,能夠更好地實現(xiàn)轉(zhuǎn)錄組測序,且測序結(jié)果及確定的轉(zhuǎn)錄本序列準(zhǔn)確可靠、數(shù)據(jù)偏向性低,有利于后續(xù)的轉(zhuǎn)錄本和可變剪切分析,且能夠有效檢測獲得新的轉(zhuǎn)錄本和可變剪切形式。在本發(fā)明的第二方面,本發(fā)明提供了一種制備參考基因組目標(biāo)mrna特異性的測序引物組的方法。根據(jù)本發(fā)明的實施例,該方法包括以下步驟:根據(jù)前面所述的制備候選測序探針集的方法,制備待測樣品的測序探針集;針對所述參考基因組目標(biāo)mrna中的每一個mrna,均單獨按照待測樣品基因組轉(zhuǎn)錄組文庫的插入片段長度x進(jìn)行區(qū)域劃分,每一個插入片段長度大小的區(qū)域作為一組,剩余不足插入片段長度大小的區(qū)域也視為一組,以便將所述參考基因組的目標(biāo)mrna分為m組,且基于各組在所述參考基因組上的位置順序,將各組依次命名為第1組、第2組……第m組;基于所述轉(zhuǎn)錄組文庫的插入片段長度x和測序讀長y,確定每一組設(shè)置的測序探針數(shù)目n,其中n≈x/y;基于所述待測樣品的候選測序探針集,在每一組均優(yōu)選出n個最優(yōu)探針作為測序探針,其中每一組的所述n個測序探針在參考基因組上的位置相鄰,且依據(jù)各測序探針在參考基因組上的位置順序,分別將每一組的測序探針以“組號-組中探針順序號”進(jìn)行命名,其中,第m組的測序探針依次為m-1、m-2……m-n;分別合并各組中探針順序號相同的測序探針,以便獲得n個參考基因組目標(biāo)mrna特異性的測序引物組,其中,第n組測序引物組中的測序探針為1-n、2-n……m-n。發(fā)明人驚奇地發(fā)現(xiàn),利用本發(fā)明的制備測序引物組的方法,能夠有效制備獲得針對參考基因組轉(zhuǎn)錄組文庫目標(biāo)mrna的特異性測序引物組,進(jìn)而利用該特異性測序引物組進(jìn)行測序得到的短讀長進(jìn)行連續(xù)較長讀長的組合,能夠更好地實現(xiàn)轉(zhuǎn)錄組測序,且測序結(jié)果及確定的轉(zhuǎn)錄本序列準(zhǔn)確可靠、數(shù)據(jù)偏向性低,有利于后續(xù)的轉(zhuǎn)錄本和可變剪切分析,且能夠有效檢測獲得新的轉(zhuǎn)錄本和可變剪切形式。根據(jù)本發(fā)明的實施例,所述基因組轉(zhuǎn)錄組文庫由以單鏈環(huán)狀dna形式存在的插入片段構(gòu)成。根據(jù)本發(fā)明的實施例,x=200,y=50,n=4。由此,獲得的測序引物組特異性高。根據(jù)本發(fā)明的實施例,所述參考基因組為人參考基因組。根據(jù)本發(fā)明的實施例,基于所述待測樣品的候選測序探針集,在每一組均優(yōu)選出n個最優(yōu)探針作為測序探針,進(jìn)一步包括:針對每一組的n個最優(yōu)探針,使每相鄰的兩個最優(yōu)探針之間的距離為測序讀長;以及當(dāng)優(yōu)選位置的探針為非特異性的探針時,重新在該優(yōu)選位置的上下游10nt的位置進(jìn)行探針選擇,篩選最優(yōu)探針。由此,篩選獲得的測序探針特異性高。在本發(fā)明的第三方面,本發(fā)明提供了一種確定待測樣品轉(zhuǎn)錄組文庫的目標(biāo)mrna序列的方法。根據(jù)本發(fā)明的實施例,該方法包括以下步驟:提供待測樣品的基因組轉(zhuǎn)錄組文庫,所述基因組轉(zhuǎn)錄組文庫的插入片段長度為x;根據(jù)前面所述的制備測序引物組的方法,制備獲得n個參考基因組目標(biāo)mrna特異性的測序引物組;利用所述n個參考基因組目標(biāo)mrna特異性的測序引物組對所述待測樣品的基因組轉(zhuǎn)錄組文庫進(jìn)行梯度測序,以便獲得n組測序結(jié)果,其中,所述梯度測序包括n個測序循環(huán),依次利用第1組至第n組測序引物組進(jìn)行測序;以及基于每個測序引物組的測序探針的序列以及相應(yīng)的測序結(jié)果,確定所述待測樣品的基因組轉(zhuǎn)錄組文庫的目標(biāo)mrna的序列。根據(jù)本發(fā)明的實施例,利用本發(fā)明的確定待測樣品轉(zhuǎn)錄組文庫序列的方法,利用獲得的特異性測序引物組對待測樣品的基因組轉(zhuǎn)錄組文庫進(jìn)行梯度測序,測序結(jié)果及確定的轉(zhuǎn)錄本序列準(zhǔn)確可靠、數(shù)據(jù)偏向性低,并且基于測序得到的短讀長能夠有效進(jìn)行連續(xù)較長讀長的組合,從而有利于后續(xù)的轉(zhuǎn)錄本和可變剪切分析,且能夠有效檢測獲得新的新的轉(zhuǎn)錄本和可變剪切形式。根據(jù)本發(fā)明的實施例,所述基因組轉(zhuǎn)錄組文庫由以單鏈環(huán)狀dna形式存在的插入片段構(gòu)成。根據(jù)本發(fā)明的實施例,進(jìn)一步包括:將所述基因組轉(zhuǎn)錄組文庫中的單鏈環(huán)狀dna制備成dna納米球。由此,便于后續(xù)進(jìn)行梯度測序。根據(jù)本發(fā)明的實施例,基于每個測序引物組的測序探針的序列以及相應(yīng)的測序結(jié)果,確定所述待測樣品的基因組轉(zhuǎn)錄組文庫的目標(biāo)mrna的序列,進(jìn)一步包括:基于測序探針序列的來源和在參考基因組上的位置順序,確定測序結(jié)果中測序序列的來源;基于所述測序結(jié)果中測序序列的來源,組裝獲得轉(zhuǎn)錄本序列,所述轉(zhuǎn)錄本序列即為目標(biāo)mrna序列。由此,獲得的轉(zhuǎn)錄本序列即目標(biāo)mrna序列準(zhǔn)確可靠。根據(jù)本發(fā)明的實施例,x=200,y=50,n=4。由此,確定的待測樣品轉(zhuǎn)錄組文庫序列準(zhǔn)確可靠。根據(jù)本發(fā)明的實施例,所述參考基因組為人參考基因組。候選測序探針集制備裝置及其應(yīng)用在本發(fā)明的第四方面,本發(fā)明提供了一種候選測序探針集制備裝置。根據(jù)本發(fā)明的實施例,參照圖1,該裝置100包括:候選探針集合構(gòu)建單元10、比對單元20、候選探針篩選單元30、高度同源基因探針制備單元40和合并單元50。下面參照圖1,對本發(fā)明的候選測序探針集制備裝置100進(jìn)行詳細(xì)描述:根據(jù)本發(fā)明的實施例,所述候選探針集合構(gòu)建單元10用于基于參考基因組的目標(biāo)mrna序列,以20bp為窗口,10bp為步長設(shè)計探針,構(gòu)建候選探針集合;所述比對單元20與所述候選探針集合構(gòu)建單元10相連,用于將所述候選探針集合中的所有候選探針與所述參考基因組的目標(biāo)mrna序列進(jìn)行比對,以便獲得比對結(jié)果;所述候選探針篩選單元30與所述比對單元20相連,用于基于所述比對結(jié)果,對所述候選探針集合中的所有候選探針進(jìn)行篩選,以便得到特異性探針集,其中,所述候選探針篩選單元30適于按照以下條件進(jìn)行所述篩選:去除比對到除自身以外的mrna的位置且連續(xù)比對上的長度大于10bp且錯配小于等于2的候選探針;所述高度同源基因探針制備單元40用于針對所述參考基因組目標(biāo)mrna中的高度同源基因,以20bp為窗口,10bp為步長設(shè)計得到相同的探針,以便得到針對高度同源基因的探針;以及合并單元50,所述合并單元50分別與所述高度同源基因探針制備單元40和所述候選探針篩選單元30相連,用于合并所述特異性探針集和所述針對高度同源基因的探針,以便獲得所述候選測序探針集。發(fā)明人發(fā)現(xiàn),利用本發(fā)明的候選測序探針集制備裝置能夠有效地制備獲得針對參考基因組目標(biāo)mrna的候選測序探針集,進(jìn)而,基于對該候選測序探針集的進(jìn)一步篩選能夠有效制備獲得針對參考基因組轉(zhuǎn)錄組文庫目標(biāo)mrna的特異性測序引物組,利用該特異性測序引物組進(jìn)行測序得到的短讀長進(jìn)行連續(xù)較長讀長的組合,能夠更好地實現(xiàn)轉(zhuǎn)錄組測序,且測序結(jié)果及確定的轉(zhuǎn)錄本序列準(zhǔn)確可靠、數(shù)據(jù)偏向性低,有利于后續(xù)的轉(zhuǎn)錄本和可變剪切分析,且能夠有效檢測獲得新的轉(zhuǎn)錄本和可變剪切形式。在本發(fā)明的第五方面,本發(fā)明提供了一種測序引物組制備設(shè)備。根據(jù)本發(fā)明的實施例,參照圖2,該測序引物組制備設(shè)備1000包括:候選測序探針集制備裝置100、mrna分組裝置200、測序探針數(shù)目確定裝置300、測序探針序列確定及命名裝置400和測序引物組確定裝置500。下面參照圖2,對本發(fā)明的測序引物組制備設(shè)備1000進(jìn)行詳細(xì)描述:根據(jù)本發(fā)明的實施例,所述候選測序探針集制備裝置100用于制備待測樣品的測序探針集;所述mrna分組裝置200用于針對所述參考基因組目標(biāo)mrna中的每一個mrna,均單獨按照待測樣品基因組轉(zhuǎn)錄組文庫的插入片段長度x進(jìn)行區(qū)域劃分,每一個插入片段長度大小的區(qū)域作為一組,剩余不足插入片段長度大小的區(qū)域也視為一組,以便將所述參考基因組的目標(biāo)mrna分為m組,且基于各組在所述參考基因組上的位置順序,將各組依次命名為第1組、第2組……第m組;所述測序探針數(shù)目確定裝置300用于基于所述轉(zhuǎn)錄組文庫的插入片段長度x和測序讀長y,確定每一組設(shè)置的測序探針數(shù)目n,其中n≈x/y;所述測序探針序列確定及命名裝置400分別與所述候選測序探針集制備裝置100、所述mrna分組裝置200和所述測序探針數(shù)目確定裝置300相連,用于基于所述待測樣品的候選測序探針集,在每一組均優(yōu)選出n個最優(yōu)探針作為測序探針,其中每一組的所述n個測序探針在參考基因組上的位置相鄰,且依據(jù)各測序探針在參考基因組上的位置順序,分別將每一組的測序探針以“組號-組中探針順序號”進(jìn)行命名,其中,第m組的測序探針依次為m-1、m-2……m-n;所述測序引物組確定裝置500與所述測序探針序列確定及命名裝置400相連,用于分別合并各組中探針順序號相同的測序探針,以便獲得n個參考基因組目標(biāo)mrna特異性的測序引物組,其中,第n組測序引物組中的測序探針為1-n、2-n……m-n。發(fā)明人驚奇地發(fā)現(xiàn),利用本發(fā)明的測序引物組制備設(shè)備能夠有效制備獲得針對參考基因組轉(zhuǎn)錄組文庫目標(biāo)mrna的特異性測序引物組,進(jìn)而利用該特異性測序引物組進(jìn)行測序得到的短讀長進(jìn)行連續(xù)較長讀長的組合,能夠更好地實現(xiàn)轉(zhuǎn)錄組測序,且測序結(jié)果及確定的轉(zhuǎn)錄本序列準(zhǔn)確可靠、數(shù)據(jù)偏向性低,有利于后續(xù)的轉(zhuǎn)錄本和可變剪切分析,且能夠有效檢測獲得新的轉(zhuǎn)錄本和可變剪切形式。根據(jù)本發(fā)明的實施例,所述基因組轉(zhuǎn)錄組文庫由以單鏈環(huán)狀dna形式存在的插入片段構(gòu)成。根據(jù)本發(fā)明的實施例,x=200,y=50,n=4。由此,獲得的測序引物組特異性高。根據(jù)本發(fā)明的實施例,所述參考基因組為人參考基因組。根據(jù)本發(fā)明的實施例,所述測序探針序列確定及命名裝置400進(jìn)一步適于進(jìn)行以下操作,以便基于所述待測樣品的候選測序探針集,在每一組均優(yōu)選出n個最優(yōu)探針作為測序探針:針對每一組的n個最優(yōu)探針,使每相鄰的兩個最優(yōu)探針之間的距離為測序讀長;以及當(dāng)優(yōu)選位置的探針為非特異性的探針時,重新在該優(yōu)選位置的上下游10nt的位置進(jìn)行探針選擇,篩選最優(yōu)探針。由此,篩選獲得的測序探針特異性高。在本發(fā)明的第六方面,本發(fā)明提供了一種用于確定待測樣品轉(zhuǎn)錄組文庫的目標(biāo)mrna序列的系統(tǒng)。根據(jù)本發(fā)明的實施例,參照圖3,該用于確定待測樣品轉(zhuǎn)錄組文庫的目標(biāo)mrna序列的系統(tǒng)10000包括:測序引物組制備設(shè)備1000、轉(zhuǎn)錄組文庫提供設(shè)備2000、測序設(shè)備3000和文庫序列確定設(shè)備4000。下面參照圖3,對本發(fā)明的用于確定待測樣品轉(zhuǎn)錄組文庫的目標(biāo)mrna序列的系統(tǒng)10000進(jìn)行詳細(xì)描述:根據(jù)本發(fā)明的實施例,所述轉(zhuǎn)錄組文庫提供設(shè)備2000用于提供待測樣品的基因組轉(zhuǎn)錄組文庫,所述基因組轉(zhuǎn)錄組文庫的插入片段長度為x;所述測序引物組制備設(shè)備1000用于制備獲得n個參考基因組目標(biāo)mrna特異性的測序引物組;所述測序設(shè)備3000分別與所述轉(zhuǎn)錄組文庫提供設(shè)備2000和所述測序引物組制備設(shè)備1000相連,用于利用所述n個參考基因組目標(biāo)mrna特異性的測序引物組對所述待測樣品的基因組轉(zhuǎn)錄組文庫進(jìn)行梯度測序,以便獲得n組測序結(jié)果,其中,所述梯度測序包括n個測序循環(huán),依次利用第1組至第n組測序引物組進(jìn)行測序;所述文庫序列確定設(shè)備4000與所述測序設(shè)備3000相連,用于基于每個測序引物組的測序探針的序列以及相應(yīng)的測序結(jié)果,確定所述待測樣品的基因組轉(zhuǎn)錄組文庫的目標(biāo)mrna的序列。根據(jù)本發(fā)明的實施例,本發(fā)明的用于確定待測樣品轉(zhuǎn)錄組文庫的目標(biāo)mrna序列的系統(tǒng),能夠利用獲得的特異性測序引物組對待測樣品的基因組轉(zhuǎn)錄組文庫進(jìn)行梯度測序,測序結(jié)果及確定的轉(zhuǎn)錄本序列準(zhǔn)確可靠、數(shù)據(jù)偏向性低,并且基于測序得到的短讀長能夠有效進(jìn)行連續(xù)較長讀長的組合,從而有利于后續(xù)的轉(zhuǎn)錄本和可變剪切分析,且能夠有效檢測獲得新的轉(zhuǎn)錄本和可變剪切形式。根據(jù)本發(fā)明的實施例,所述基因組轉(zhuǎn)錄組文庫由以單鏈環(huán)狀dna形式存在的插入片段構(gòu)成。根據(jù)本發(fā)明的實施例,進(jìn)一步包括dna納米球制備設(shè)備,所述dna納米球制備設(shè)備與所述轉(zhuǎn)錄組文庫提供設(shè)備2000和所述測序設(shè)備3000相連,用于在進(jìn)行所述梯度測序之前,將所述基因組轉(zhuǎn)錄組文庫中的單鏈環(huán)狀dna制備成dna納米球。由此,便于后續(xù)進(jìn)行梯度測序。根據(jù)本發(fā)明的實施例,所述文庫序列確定設(shè)備4000適于進(jìn)行以下操作:基于測序探針序列的來源和在參考基因組上的位置順序,確定測序結(jié)果中測序序列的來源;基于所述測序結(jié)果中測序序列的來源,組裝獲得轉(zhuǎn)錄本序列,所述轉(zhuǎn)錄本序列即為目標(biāo)mrna序列。由此,獲得的轉(zhuǎn)錄本序列即目標(biāo)mrna序列準(zhǔn)確可靠。根據(jù)本發(fā)明的實施例,x=200,y=50,n=4。由此,確定的待測樣品轉(zhuǎn)錄組文庫序列準(zhǔn)確可靠。根據(jù)本發(fā)明的實施例,所述參考基因組為人參考基因組。根據(jù)本發(fā)明的實施例,本發(fā)明的確定待測樣品轉(zhuǎn)錄組文庫序列的方法和裝置具有下列優(yōu)點的至少之一:1、本發(fā)明基于rna數(shù)據(jù)庫將mrna(目標(biāo)mrna例如基因組的全部mrna)按照文庫長度大小進(jìn)行窗口區(qū)分,篩選得到特異的探針序列信息,進(jìn)而根據(jù)特異探針序列和同一mrna探針簇關(guān)系精確定位所測序列到mrna上,避免了軟件比對上帶來的誤差,準(zhǔn)確計算gene表達(dá)量和鑒定變異;并且,根據(jù)同一mrna探針簇聚類測序read,局部組裝mrna,從而檢測新的轉(zhuǎn)錄本和可變剪切形式。2、本發(fā)明測序過程中將dna納米球進(jìn)行物理距離上設(shè)計的特異探針序列組成的各測序引物組的測序,對于同一個dna納米球(即同一段連續(xù)的mrna序列)測序得到的幾段讀長可以組成連續(xù)的長reads信息,從而更容易進(jìn)行后續(xù)的轉(zhuǎn)錄本分析和可變剪切的分析。3、由于測序結(jié)果中已知探針的序列,可以通過探針序列的來源和前后順序準(zhǔn)確地確定測序序列的來源和組裝轉(zhuǎn)錄本序列,從而可以準(zhǔn)確無誤的計算基因的表達(dá)量,鑒定可變剪切方式和得到新的轉(zhuǎn)錄本。下面將結(jié)合實施例對本發(fā)明的方案進(jìn)行解釋。本領(lǐng)域技術(shù)人員將會理解,下面的實施例僅用于說明本發(fā)明,而不應(yīng)視為限定本發(fā)明的范圍。實施例中未注明具體技術(shù)或條件的,按照本領(lǐng)域內(nèi)的文獻(xiàn)所描述的技術(shù)或條件(例如參考j.薩姆布魯克等著,黃培堂等譯的《分子克隆實驗指南》,第三版,科學(xué)出版社)或者按照產(chǎn)品說明書進(jìn)行。所用試劑或儀器未注明生產(chǎn)廠商者,均為可以通過市購獲得的常規(guī)產(chǎn)品,例如可以采購自illumina公司。實施例1:一、構(gòu)建轉(zhuǎn)錄組文庫1.核糖體探針與總rna退火1)取200ng-5μg總rna樣品(maqc標(biāo)準(zhǔn)品)于rnase–free的0.2mlpcr管中。rna200ng-5μg雜交探針(10μm)2μl5×雜交緩沖液1μl水(無核酸酶)補至總體積為5μl其中,采用的雜交探針為申請?zhí)枮閏n201410505793.2的專利申請實施例1中所采用的探針,其具體序列請參見該專利申請的說明書,在此將其全文并入本文。2)95℃,2min;梯度降溫0.1℃/sec;22℃5min。3)反應(yīng)結(jié)束后,迅速置于冰上,進(jìn)行下一步反應(yīng)。2.rnaseh酶消化1)按照下列的配比準(zhǔn)備反應(yīng)混合物:2)37℃,反應(yīng)30min。3)反應(yīng)結(jié)束后,迅速置于冰上,進(jìn)行下一步反應(yīng)。3.dnasei酶消化1)按照下列的配比準(zhǔn)備反應(yīng)混合物:2)37℃,反應(yīng)30min。3)反應(yīng)結(jié)束后,用1.2xrnacleanxp磁珠(30μl)純化,最后溶于10μlnucleasefreewater?!咀⒁馐马棥砍盖信c變性過程外,以上其它操作均要在冰上進(jìn)行以減少rna降解。4.mrna片段化向上一步中的洗脫液中加入3μl5×打斷緩沖液(其包含:250mmtris-hcl(ph8.3),375mmkcl,15mmmgcl2),94℃,10min,立即置于冰上。5.一鏈cdna合成并引入接頭1)制備接頭:將序列3t和序列5t稀釋到100μm,充分混合后離心,分別于3b、5b序列,按如下比例分別配制成3'接頭和5'接頭,具體如下:h2o9μl1mtris80.5μl5mnacl0.5μl100μmt序列20μl100μmb序列20μl總體積50μl其中,3t序列:n*nnnnnaagtcggaggccaagc,其中n表示隨機引物,*表示硫代修飾,5t序列:ggtcttaggaagacaagctcxxxxxxxxxxgactcactgagatcgggcttcgactggagacnnnnnn,其中,n表示隨機引物,x表示標(biāo)簽序列:標(biāo)簽序列名稱序列(seqidno:)標(biāo)簽序列1tgtcataaat(1)標(biāo)簽序列2ttaattaagg(2)標(biāo)簽序列3gactcactga(3)標(biāo)簽序列4ataaggcagt(4)標(biāo)簽序列5ttgatagatt(5)標(biāo)簽序列6ccttcctggt(6)標(biāo)簽序列7aatatctctc(7)標(biāo)簽序列8catgtttccc(8)3b:gcttggcctccgactt(seqidno:9),5b:gtctccagtcgaagcccgatctcagtgagtcgagcttgtct(seqidno:10),3t序列+3b序列=3'接頭,5t序列+5b序列=5'接頭,然后,按照下表中的體系(接頭混合物中兩種接頭的配比為:[5'接頭]:[3'接頭]=1:2),制備接頭混合物:無rna酶水50μl40μm5'接頭10μl40μm3'接頭20μl總體積80μl向5μl已純化的mrna(上述步驟4獲得的經(jīng)過片段化的mrna)中加0.6μl10μm上述制備的接頭混合物,25°孵育5min;孵育結(jié)束后,加入以下反應(yīng)混合液:--退火混勻,在pcr儀上按照以下程序進(jìn)行反應(yīng):step125℃2minstep237℃1hstep312℃hold反應(yīng)結(jié)束后,向以上反應(yīng)體積中加1μlrnasea、1μlrnaseh,37℃30min~1h。2)純化:用1.0xampurexpbeads純化,用te或純水回溶。取1μl樣品用hsqubit定量。按照測定的濃度調(diào)整下一步反應(yīng)使用的樣本起始量不超過400ng使用1xte將總體積補為60μl。3)取60μl上述步驟的dna到pcr管中,95°變性5min,立即置于冰上2min。6.cdna環(huán)化及線性消化1)提前5分鐘左右準(zhǔn)備引物反應(yīng)混合液,配制如下:橋引物:5’-tcgagcttgtcttcctaagaccgc-3’(seqidno:11),2)將上述混合液震蕩充分混勻,離心后,向上一步得到的樣品中加入16.4μl的引物反應(yīng)混合液;3)提前5分鐘準(zhǔn)備連接酶反應(yīng)混合液,配制如下:4)將連接酶反應(yīng)混合液震蕩充分混勻,離心后,向已經(jīng)加入引物反應(yīng)混合液的ep管中加入連接酶反應(yīng)混合液22.3μl,震蕩10s混勻,spin離心。5)置于孵育箱中37℃孵育1.5h。6)提前5分鐘左右準(zhǔn)備外切酶反應(yīng)混合液,配制如下:7)將上述混合液震蕩充分混勻,離心后,向上一步得到的70μl的樣品中分別加入10μl的反應(yīng)混合液;8)震蕩10s混勻離心,置于孵育箱中37℃孵育30min。9)酶切30min完成后,向樣品中加入3μl500mmedta終止酶反應(yīng),并用磁珠純化得到單鏈環(huán)狀的dna文庫分子。二、制備測序引物組1.制備候選測序探針集1)針對參考基因組的全部mrna序列(http://hgdownload.cse.ucsc.edu/goldenpath/hg38/database/),以20bp為窗口,10bp為步長設(shè)計探針,取序列構(gòu)建候選探針集合t。2)將候選探針集合t與所述參考基因組的全部mrna序列進(jìn)行比對,并基于比對結(jié)果對候選探針集合t中的所有候選探針進(jìn)行篩選,以便得到特異性探針集。其中,所述篩選包括:去除比對到除自身以外的mrna的位置且連續(xù)比對上的長度大于10bp且錯配小于等于2的候選探針。3)高度同源基因的探針設(shè)計:因為任何一個物種中都包含有部分高度相似的基因即高度同源基因,這些基因的探針是不能通過第二步的方法得到非特異探針的,因此,針對它們,發(fā)明人設(shè)置相同的探針。即針對參考基因組中的高度同源基因,按照步驟(1)的方法設(shè)計得到相同的探針,以便得到針對高度同源基因的探針。4)合并所述特異性探針集和所述針對高度同源基因的探針,以便獲得候選測序探針集。另外,需要說明的是,針對候選測序探針集的覆蓋度:對于任意一個200nt的mrna環(huán)化片段,最優(yōu)狀態(tài)下只需要4個探針就可以把整個200nt的片段測通;如果任意兩個最優(yōu)探針之間所有的探針都是非特異的探針,那么該區(qū)域50nt的長度為測序未覆蓋區(qū),該區(qū)域有特異探針存在,則在其他mrna片段可以測到該區(qū)域。如圖4所示,基于全轉(zhuǎn)錄組的參考序列,本實施例針對轉(zhuǎn)錄組本身的序列特點設(shè)計出全轉(zhuǎn)錄組范圍內(nèi)位于不同位置的20bp的探針長度,用于介導(dǎo)高通量測序,而經(jīng)過篩選后得到最佳的20bp的探針序列組(標(biāo)記有1、2、3、4的序號)以使得設(shè)計的探針(即候選測序探針集中的探針)在最少條數(shù)的情況下得以最大范圍的覆蓋全轉(zhuǎn)錄組的參考序列。2.制備測序引物組插入片段長度x=200,測序讀長y=50,具體步驟如下:1)針對所述參考基因組的每一個mrna,均單獨按照待測樣品基因組轉(zhuǎn)錄組文庫的插入片段長度x進(jìn)行區(qū)域劃分,每一個插入片段長度大小的區(qū)域作為一組,剩余不足插入片段長度大小的區(qū)域也視為一組,以便將所述參考基因組的所有mrna分為m組,且基于各組在所述參考基因組上的位置順序,將各組依次命名為第1組、第2組……第m組,針對本實施例,m=mrna總長度/x;2)基于所述轉(zhuǎn)錄組文庫的插入片段長度x和測序讀長y,確定每一組設(shè)置的測序探針數(shù)目n,其中n≈x/y=4;3)基于前述制備獲得的待測樣品的候選測序探針集,在每一組均優(yōu)選出n個最優(yōu)探針作為測序探針,其中每一組的所述n個測序探針在參考基因組上的位置相鄰,且依據(jù)各測序探針在參考基因組上的位置順序,分別將每一組的測序探針以“組號-組中探針順序號”進(jìn)行命名,其中,第m組的測序探針依次為m-1、m-2……m-n;4)分別合并各組中探針順序號相同的測序探針,以便獲得n個參考基因組目標(biāo)mrna特異性的測序引物組,其中,第n組測序引物組中的測序探針為1-n、2-n……m-n。具體地,例如:各組的1號探針合并混合成第一組測序引物組即“測序引物組1”(包含1-1、2-1、3-1……m-1),各組的2號探針合并混合成第二組測序引物組即“測序引物組2”(包含1-2、2-2、3-2……m-2),各組的3號探針合并混合成第三組測序引物組即“測序引物組3”(包含1-3、2-3、3-3……m-3),依次類推。由此,可將轉(zhuǎn)錄組的片段按照200bp插入片段的規(guī)格在三條不同引物的覆蓋下全部測通,將組裝到的200bp測序讀長串聯(lián)之后即可將全轉(zhuǎn)錄組的序列進(jìn)行解析。從而達(dá)到了真正意義上的全轉(zhuǎn)錄組測序。三、引物組測序按照以下步驟進(jìn)行測序:1)將前述制備完成的單鏈dna環(huán)狀文庫經(jīng)過引物擴增,使用phi29dna聚合酶在30℃條件下滾環(huán)復(fù)制40min得到dna納米球。擴增引物為前述的橋引物:5’-tcgagcttgtcttcctaagaccgc-3’(seqidno:11)。2)基于completegenomics測序平臺,利用前面制備獲得的n個參考基因組目標(biāo)mrna特異性的測序引物組將上述得到dna納米球進(jìn)行梯度測序,以便獲得n組測序結(jié)果,其中,所述梯度測序包括n個測序循環(huán),依次利用第1組至第n組測序引物組進(jìn)行測序。具體地,將dna納米球經(jīng)過測序引物組1退火后進(jìn)行后續(xù)測序,隨后進(jìn)行測序引物組2至測序引物組n的測序(如圖5所示),同一個dna納米球測序產(chǎn)出的讀長在物理位置上屬于同一個長片段的mrna序列。其中,不同測序引物組測序的是一個dna納米球分子的不同區(qū)域,累加后可以覆蓋整個dna納米球序列,而所有納米球累加則覆蓋整個轉(zhuǎn)錄組序列,由此,達(dá)到了全轉(zhuǎn)錄組測序的目的。四、序列確定及分析基于每個測序引物組的測序探針的序列以及相應(yīng)的測序結(jié)果,確定所述待測樣品的基因組轉(zhuǎn)錄組文庫的序列。具體地,基于測序探針序列的來源和其在參考基因組上的位置順序,確定測序結(jié)果中測序序列的來源;然后,基于所述測序結(jié)果中測序序列的來源,組裝獲得轉(zhuǎn)錄本序列。結(jié)果發(fā)現(xiàn),利用前述獲得的特異性測序引物組對待測樣品的基因組轉(zhuǎn)錄組文庫進(jìn)行梯度測序,測序結(jié)果及確定的轉(zhuǎn)錄本序列準(zhǔn)確可靠、數(shù)據(jù)偏向性低,并且基于測序得到的短讀長能夠有效進(jìn)行連續(xù)較長讀長的組合,而后續(xù)的轉(zhuǎn)錄本和可變剪切分析較容易,且能夠有效檢測獲得新的新的轉(zhuǎn)錄本和可變剪切形式。在本說明書的描述中,參考術(shù)語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結(jié)合。盡管已經(jīng)示出和描述了本發(fā)明的實施例,本領(lǐng)域的普通技術(shù)人員可以理解:在不脫離本發(fā)明的原理和宗旨的情況下可以對這些實施例進(jìn)行多種變化、修改、替換和變型,本發(fā)明的范圍由權(quán)利要求及其等同物限定。當(dāng)前第1頁12