專利名稱:待測核酸序列的編碼及解碼方法
技術(shù)領(lǐng)域:
本發(fā)明是一種實(shí)現(xiàn)了不同樣本核酸序列或者同一樣本不同核酸序列高通量同時(shí) 分析的方法,尤其涉及一種待測核酸序列的編碼及解碼方法。
背景技術(shù):
隨著人類基因組計(jì)劃和各種模式生物基因組計(jì)劃的開展和完成,使人類步入了 后基因時(shí)代,對(duì)當(dāng)代的生物學(xué)研究和醫(yī)學(xué)研究產(chǎn)生了巨大的影響,分子生物學(xué)相關(guān)學(xué) 科得到了迅猛的發(fā)展。從基因水平上認(rèn)識(shí)生命的差異,疾病發(fā)生、發(fā)展的規(guī)律,以及 藥物與生命體的相互作用將成為可能。就基因序列分析而言,后基因時(shí)代的重點(diǎn)已由 全基因組序列測定轉(zhuǎn)移到了對(duì)基因組中個(gè)體遺傳差異及物種間遺傳差異的比較。目 前,無論是找尋新的還是確認(rèn)已知SNP位點(diǎn),傳統(tǒng)的Sanger DNA測序法,仍處于無可
替代的地位。但這一方法存在通量低和價(jià)格高的問題。第一個(gè)人類基因組序列測定的 費(fèi)用大約為10億美元,目前這一費(fèi)用已經(jīng)降低到大約2千萬美元。但是,功能基因組 的研究進(jìn)展仍然受限于DNA測序技術(shù)。為此,美國Venter基金會(huì)在2003年提出了1000 美金人類全基因組測序的研究目標(biāo)。2004年初,美國國立衛(wèi)生院投入7千多萬美元支 持DNA測序新技術(shù)的研究計(jì)劃,其目標(biāo)是發(fā)展10萬美金的測序技術(shù),并最終減低為l千 美金。美國國立衛(wèi)生研究院人類基因組研究中心主任Collins教授指出大幅度降低 DNA測序的成本將會(huì)大大推動(dòng)生命科學(xué)和醫(yī)學(xué)的研究,甚至?xí)砀锩缘淖兓?。?前,全基因組DNA測序技術(shù)己經(jīng)成為國際上一個(gè)競爭十分激烈的研究領(lǐng)域。美國的454 LifeSciences公司基于乳液PCR產(chǎn)物的高通量并行焦測序技術(shù);Illumina (Solexa) 公司的橋式擴(kuò)增-DNA芯片延伸測序技術(shù);以及Applied Biosesteras (SOLiD)公司基 于乳液PCR產(chǎn)物的雜交-酶連接-酶切割高通量測序技術(shù)都有成熟的商品化儀器上市。
然而,這些儀器均主要針對(duì)全基因組測序而開發(fā)的,每次可以對(duì)上千萬的序列 進(jìn)行同時(shí)檢測,雖然相對(duì)于全基因組序列測定其費(fèi)用比以往有大幅度的降低,然而針 對(duì)某些通量不需要這樣高的序列分析,檢測費(fèi)用相當(dāng)昂貴。因此,如果能將許多這些 通量不是很高的樣本組合到一起來進(jìn)行分析,無疑攤派到每個(gè)樣本上的費(fèi)用將大大降 低。
本發(fā)明的目的就是通過一種基于堿基序列編碼及其解碼方法應(yīng)用堿基A、 G、 C、
T構(gòu)成的已知核酸序列為碼,作為連接子或者擴(kuò)增引物中的一個(gè)序列片段,通過對(duì)待
分析的核酸序列進(jìn)行連接或者擴(kuò)增而實(shí)現(xiàn)對(duì)待分析核酸序列編碼,然后對(duì)這些編碼的 核酸序列直接或者通過擴(kuò)增放大固定在載體上進(jìn)行高通量序列檢測,完成對(duì)所有編碼 核酸序列的分析和對(duì)所有碼進(jìn)行解碼。
發(fā)明內(nèi)容
本發(fā)明提供一種能夠有效解決現(xiàn)有高能量DNA序列測定技術(shù)與用戶所測樣品通量 較低但樣品數(shù)多的矛盾的待測核酸序列的編碼及解碼方法,本發(fā)明有助于降低測定成 本,具有方法簡單的優(yōu)點(diǎn)。
本發(fā)明采用如下技術(shù)方案
本發(fā)明所述的一種待測核酸序列的編碼方法,將每個(gè)待測的核酸序列分別切割成 核酸片段,再在核酸片段的兩端分別連接一個(gè)連接子,使其形成模板,其中一個(gè)連接 子由一段擴(kuò)增的(與測序引物互補(bǔ))序列片段和一段序列碼構(gòu)成,并且使屬于同一核
酸序列的核酸片段上的序列碼相同,由此形成編碼的待測核酸序列,上述序列碼由A、 T、 C或G四種堿基構(gòu)成并用人工合成的方法得到。
本發(fā)明所述的一種適于權(quán)利要求1所述待測核酸序列的編碼方法的解碼方法,以 擴(kuò)增引物序列片段對(duì)應(yīng)的互補(bǔ)片段作為模板的測序引物,用現(xiàn)有的堿基序列測定方 法,測定已編碼的待測核酸序列上的序列碼,從而得到序列碼的A、 T、 C或G四種堿 基構(gòu)成的片段。
本發(fā)明與現(xiàn)有技術(shù)相比,具有如下優(yōu)點(diǎn)-
本發(fā)明應(yīng)用堿基A、 G、 C、 T構(gòu)成的已知的核酸序列為序列碼,這些序列碼作為 連接子或者擴(kuò)增引物中的一個(gè)序列片段,通過對(duì)待分析的核酸序列進(jìn)行連接或者擴(kuò)增 而實(shí)現(xiàn)對(duì)待分析核酸序列編碼,然后對(duì)這些編碼的核酸序列直接或者通過擴(kuò)增放大固 定在載體上進(jìn)行高通量序列檢測,完成對(duì)所有編碼核酸序列的分析和對(duì)所有碼進(jìn)行解 碼。
1. 本發(fā)明的最大優(yōu)點(diǎn)是實(shí)現(xiàn)了不同樣本的同時(shí)檢測,解決了現(xiàn)有的高能量DNA序 列測定技術(shù)與用戶所測樣品通量較低但樣品數(shù)多的矛盾,大大降低了實(shí)驗(yàn)成本。
2. 本發(fā)明將每個(gè)樣本進(jìn)行分別編碼后,可將不同樣本的模板制備、芯片制備、以 及序列測定的合并進(jìn)行,與目前廣泛使用的核酸序列分析方法兼容,大大簡化了分析 不同樣本的操作工藝。
3. 本發(fā)明適用面廣。編碼數(shù)目不受限制,而且可以和目前廣泛使用的微珠編碼,以及空間位置編碼相兼容使用,可以用于DNA、 RNA的編碼和編碼DNA、 RNA的 其它檢測應(yīng)用。
4.本發(fā)明方法簡單,易于解碼。用于編碼核酸的堿基序列可以通過人工合成在連 接子上,通過編碼的連接子連接待測序的核酸而編碼核酸;編碼核酸的碼可以通過同 時(shí)待測核酸序列測定和碼序列而得到解碼。
圖1是本發(fā)明一種堿基序列編碼、解碼核酸序列方法的編碼核酸序列過程示意圖。
圖2是本發(fā)明一種堿基序列編碼、解碼核酸序列方法的解碼核酸序列示意圖之一。
圖3是本發(fā)明一種堿基序列編碼、解碼核酸序列方法的解碼核酸序列示意圖之二。
具體實(shí)施例方式
一種待測核酸序列的編碼方法,將每個(gè)待測的核酸序列分別切割成核酸片段2, 再在核酸片段2的兩端分別連接一個(gè)連接子3、 4,使其形成模板,其中一個(gè)連接子4 由一段擴(kuò)增的(與測序引物互補(bǔ))序列片段4-l和一段序列碼4-2構(gòu)成,并且使屬于 同一核酸序列的核酸片段上的序列碼相同,由此形成編碼的待測核酸序列,上述序列 碼4-2由A、 T、 C或G四種堿基構(gòu)成并用人工合成的方法得到。
堿基序列碼實(shí)際上是合成在一組特定的已知堿基序列片段,每個(gè)碼具有已知唯一 的堿基序列。這些堿基序列碼是先通過編碼連接子或者擴(kuò)增引物,然后對(duì)待分析的核 酸序列進(jìn)行連接或者擴(kuò)增而實(shí)現(xiàn)對(duì)待分析核酸序列編碼的,亦即是一組編碼的寡核苷 酸序列通過連接、或者作為PCR擴(kuò)增引物轉(zhuǎn)入到待分析的核酸序列片段中實(shí)現(xiàn)對(duì)待分 析核酸序列編碼。編碼核酸序列最好通過擴(kuò)增放大后固定在載體上進(jìn)行高通量序列檢 測,完成對(duì)所有編碼核酸序列的分析和對(duì)所有碼進(jìn)行解碼,實(shí)現(xiàn)不同樣本核酸序列的 高通量分析。
一種適于權(quán)利要求1所述待測核酸序列的編碼方法的解碼方法,以擴(kuò)增引物序列 片段4-l對(duì)應(yīng)的互補(bǔ)片段7作為模板的測序引物,用現(xiàn)有的堿基序列測定方法,測定 已編碼的待測核酸序列上的序列碼4-2,從而得到序列碼4-2的A、 T、 C或G四種堿 基構(gòu)成的片段。
本發(fā)明的具體做法為首先,用酶切或其他方法把樣本片段化。然后,把片段化 的序列兩端加上接頭,其中一個(gè)接頭的3或者5未端位置含有特定的堿基序列碼。再 把所有這些編碼核酸序列樣品混合在一起,通過接頭引物上的公共序列進(jìn)行單克隆擴(kuò)增;或者片段化的序列兩端加上接頭后用一個(gè)含有堿基序列碼的引物對(duì)片段化序列進(jìn)行擴(kuò)增。對(duì)擴(kuò)增產(chǎn)物進(jìn)行序列分析后,完成對(duì)所有編碼核酸序列的分析和對(duì)所有碼進(jìn)行解碼,便可以知道各克隆或者擴(kuò)增產(chǎn)物所對(duì)應(yīng)的樣品及其序列信息。
以下將結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步說明。
參照?qǐng)Dl,基因組序列l(wèi)用酶切割(或者超聲破碎)成一定堿基數(shù)目的核酸片段2),并在連接酶的作用下,將這些片段化核酸序列2用一對(duì)連接子進(jìn)行連接子3、4連接成模板5,其中連接子4由一段擴(kuò)增引物序列片段4-1和一段獨(dú)特已知堿基序列 碼4-2構(gòu)成。這樣通過將堿基序列碼引入到待分析的核酸序列中,就實(shí)現(xiàn)了核酸序列的編碼。
參照?qǐng)D2,包括序列待測片段2、連接子3、 4的擴(kuò)增產(chǎn)物,即DNA測序模板固定 到載體6上。用擴(kuò)增引物序列片段4-l對(duì)應(yīng)的互補(bǔ)片段7作為模板的測序引物,按照目前的序列測定方法,測定編碼序列4-2和序列待測片段2,由于碼序列與一段已知 序列相連接,因此解碼和編碼具有準(zhǔn)確一一對(duì)應(yīng)關(guān)系。這樣就實(shí)現(xiàn)了編碼核酸序列的解碼以及相對(duì)應(yīng)編碼待測序列的測定。
參照?qǐng)D3,包括序列待測片段2、連接子3、 4的擴(kuò)增產(chǎn)物,即DNA測序模板固定到載體6上。用引物序列片段4-l對(duì)應(yīng)的互補(bǔ)片段8作為解碼的測序引物,按照目前的序列測定方法,測定編碼序列4-2,這樣就實(shí)現(xiàn)了編碼序列的解碼。這種情況下, 將解碼的測序引物用變性的方法清除,然后采甩連接子3對(duì)應(yīng)的互補(bǔ)片段作為編碼核酸序列的測序引物,按照目前的序列測定方法,測定編碼核酸的堿基序列。使用兩對(duì) 引物測序后,就完成了編碼核酸序列的解碼以及對(duì)應(yīng)編碼核酸序列的測定。
實(shí)例l:編碼不同樣本DNA序列的高通量分析。
將不同樣本DNA序列用酶切割(或者超聲破碎)成大小為50-100堿基的片段,并在連接酶的作用下將這些片段化核酸序列用一對(duì)連接子進(jìn)行連接(其中一個(gè)為通用 連接子寡核酸序列與擴(kuò)增引物的序列完全互補(bǔ),另一個(gè)為帶有不同樣本相對(duì)應(yīng)的獨(dú)特 已知序列編碼和一段與測序引物相同的寡核苷酸序列片段。
將這些連接臂連接的片段化核酸序列與固定連接子互補(bǔ)序列到微珠進(jìn)行乳液并行PCR反應(yīng),擴(kuò)增片段化的人全基因組。并將這些微珠固定到平板基片上,通過酶切 或者變性得到不同樣本DNA序列的測序模板。
采用現(xiàn)行的序列測定方法將這些不同樣本DNA序列確定。由于編碼序列與測序引物相同的寡核苷酸序列片段相連接,因此當(dāng)所有序列測定(解碼)后,通過對(duì)照序列 上編碼區(qū)域?qū)?yīng)的編碼便可用確定哪些序列歸屬哪些分析樣本。
實(shí)例2 :編碼不同來源mRNA序列的表達(dá)分析。
步驟1:分別提取多種不同來源的細(xì)胞mRNA,用磁珠固定有30個(gè)T的核苷酸鏈通過雜交mRNA的方式純化mRNA。
步驟2:分別反轉(zhuǎn)錄為cDNA,并用RNaseH、 DNA聚合酶等作用下合成第二鏈。
步驟3:用識(shí)別四個(gè)堿基的內(nèi)切酶(Sau3AI)消化上述雙鏈核酸序列,并用緩沖液洗干凈磁珠。
步驟4:在連接酶的作用下將上述消化的雙鏈核酸序列加上接頭引物3 (引物上帶有內(nèi)切酶Acu I識(shí)別位點(diǎn))。
步驟5:用Acu I消化步驟4的產(chǎn)物。得到接頭引物3后面跟著要測的16個(gè)未知序列的cDNA文庫。
步驟6:步驟5產(chǎn)物連接一接頭引物4,對(duì)待分析核酸序列完成編碼。其中接頭引物4特點(diǎn)是5‘未端用生物素修飾;雙鏈DNA且生物修飾條鏈3‘未端有兩個(gè)突出的通用堿基(與上一步酶切產(chǎn)物相對(duì)應(yīng));突出兩個(gè)堿基之后是一些編碼序列。連接上接頭引物4后,把所有不同樣品一混在一起,然后用乳液PCR進(jìn)行擴(kuò)增。
步驟7:擴(kuò)增產(chǎn)物固定在芯片上。
步驟8:將所制備的固定的編碼DNA模板進(jìn)行高通量測序,最后通過解碼,以區(qū)分不同擴(kuò)增點(diǎn)的來源。
權(quán)利要求
1、一種待測核酸序列的編碼方法,其特征在于將每個(gè)待測的核酸序列分別切割成核酸片段(2),再在核酸片段(2)的兩端分別連接一個(gè)連接子(3、4),使其形成模板,其中一個(gè)連接子(4)由一段擴(kuò)增的(與測序引物互補(bǔ))序列片段(4-1)和一段序列碼(4-2)構(gòu)成,并且使屬于同一核酸序列的核酸片段上的序列碼相同,由此形成編碼的待測核酸序列,上述序列碼(4-2)由A、T、C或G四種堿基構(gòu)成并用人工合成的方法得到。
2、 一種適于權(quán)利要求1所述待測核酸序列的編碼方法的解碼方法,其特征 在于以擴(kuò)增引物序列片段(4-1)對(duì)應(yīng)的互補(bǔ)片段(7)作為模板的測序引物,用 現(xiàn)有的堿基序列測定方法,測定已編碼的待測核酸序列上的序列碼(4-2),從而 得到序列碼(4-2)的A、 T、 C或G四種堿基構(gòu)成的片段。
全文摘要
本發(fā)明公開了一種待測核酸序列的編碼方法,是一種實(shí)現(xiàn)了不同樣本核酸序列或者同一樣本不同核酸序列高通量同時(shí)分析的方法,尤其涉及一種待測核酸序列的編碼及解碼方法。本發(fā)明的方案是將每個(gè)待測的核酸序列分別切割成核酸片段,再在核酸片段的兩端分別連接一個(gè)連接子,使其形成模板,其中一個(gè)連接子由一段擴(kuò)增的(與測序引物互補(bǔ))序列片段和一段序列碼構(gòu)成,并且使屬于同一核酸序列的核酸片段上的序列碼相同,由此形成編碼的待測核酸序列,上述序列碼由A、T、C或G四種堿基構(gòu)成并用人工合成的方法得到。本發(fā)明能夠解決現(xiàn)有高能量DNA序列測定技術(shù)與用戶所測樣品通量較低但樣品數(shù)多的矛盾,降低測定成本,方法簡單。
文檔編號(hào)C12Q1/68GK101200763SQ20071013558
公開日2008年6月18日 申請(qǐng)日期2007年11月13日 優(yōu)先權(quán)日2007年11月13日
發(fā)明者靜 唐, 李燕強(qiáng), 潘志強(qiáng), 肖鵬峰, 陸祖宏 申請(qǐng)人:東南大學(xué)