專(zhuān)利名稱(chēng):測(cè)定dna序列的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種測(cè)定DNA序列的方法,屬于生物信息測(cè)試技術(shù)領(lǐng)域。
DNA序列測(cè)定及分析是人類(lèi)基因組工程的重要一環(huán)。目前使用的DNA序列分析法是雙脫氧法,基本原理是將特異的引物與待測(cè)DNA配對(duì),在含有雙脫氧核苷酸的脫氧核苷酸混合物存在下,DNA聚合酶對(duì)待測(cè)DNA復(fù)制并在特異的位點(diǎn)終止,然后用變性聚丙烯酰胺凝膠電泳方法分離。實(shí)驗(yàn)中用放射性同位素或熒光染料示蹤,這種方法較為繁瑣。申請(qǐng)?zhí)?5197574.9“用于DNA測(cè)序和DNA鑒定的方法和裝置”,該專(zhuān)利基于尼龍膜上的DNA樣品矩陣,而探針儲(chǔ)存于多孔板,根據(jù)其權(quán)利要求1中所描述的方法,需重復(fù)從給定長(zhǎng)度的一套不完全探針中選擇探針,而且必須重復(fù)進(jìn)行雜交,以獲得數(shù)據(jù)擬合所需信息,每一循環(huán)都要進(jìn)行探針篩選,這給實(shí)際使用者帶來(lái)難度,實(shí)施過(guò)程中的步驟較復(fù)雜。
本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的不足,提供一種測(cè)定DNA序列的方法。
本發(fā)明的技術(shù)方案及其實(shí)施情況如下將A、C、G、T構(gòu)成的長(zhǎng)度為L(zhǎng)的所有組合的寡核苷酸片段固定于DNA芯片上,序列待測(cè)的DNA片段是熒光標(biāo)記的一組長(zhǎng)度為L(zhǎng),連接位點(diǎn)處的nz個(gè)核苷酸是已知的隨機(jī)片段,同時(shí)與DNA芯片一起保溫,進(jìn)行DNA配對(duì),與待測(cè)DNA序列配對(duì)的寡核苷酸片段被連接起來(lái),反應(yīng)后清洗DNA芯片,然后用掃描儀檢測(cè),可以獲得待測(cè)DNA片段中各種序列出現(xiàn)的頻率,可以反推出待測(cè)DNA片段的核苷酸序列。
DNA芯片的結(jié)構(gòu)芯片的總寡核苷酸探針點(diǎn)數(shù)n=4Lxy,在一個(gè)二維構(gòu)成的芯片平面,可以在X、Y軸上各選擇4nx,4ny個(gè)點(diǎn),并滿(mǎn)足下列條件4nx×4ny=4Lxy,DNA芯片就可實(shí)現(xiàn)序列展開(kāi)和反演。
寡核苷酸探針被連接已知核苷酸片段序列長(zhǎng)度為L(zhǎng),但只有連接點(diǎn)的nz個(gè)核苷酸是已知的熒光標(biāo)記的寡核苷酸片段。其已知的種類(lèi)由連接位點(diǎn)已知核苷酸的數(shù)目決定。連接位點(diǎn)已知核苷酸是1個(gè)時(shí),就只有4種。連接位點(diǎn)已知核苷酸是2個(gè)時(shí),就有16種,連接位點(diǎn)已知核苷酸是nz個(gè)時(shí),就有4nz種。待測(cè)DNA段與DNA芯片發(fā)生各種配對(duì)連接反應(yīng),信息總量是一種X、Y、Z軸構(gòu)建的立體結(jié)構(gòu),其中可包含的序列總量是N=4nx×4ny×4nz種,而每種寡核苷酸片段序列(此時(shí)的長(zhǎng)度為L(zhǎng)=Lxy+nz)在這種三維結(jié)構(gòu)中有一個(gè)特定的位置。
DNA序列是由ATCG四個(gè)編碼構(gòu)成的生命信息序列,對(duì)于長(zhǎng)度為L(zhǎng)的序列,其ATCG全組合的總數(shù)是n=4L。這樣任何一個(gè)DNA序列,其長(zhǎng)度為L(zhǎng)的片段,必定是n=4L全排列中的一個(gè)。這樣,任何一DNA序列都可用長(zhǎng)度為L(zhǎng)的ATCG全組合片段來(lái)描述,稱(chēng)之為序列展開(kāi)。當(dāng)長(zhǎng)度為L(zhǎng)的序列的ATCG全組合集合作為探針固定于DNA芯片,就可用DNA芯片實(shí)現(xiàn)序列展開(kāi)。通過(guò)逆向過(guò)程,可推算出待測(cè)樣品的序列,稱(chēng)之為序列反演。
把一長(zhǎng)度為L(zhǎng)的ATCG全組合集合作為探針固定在DNA芯片上,通過(guò)DNA配對(duì)原則(A-T,C-G),待測(cè)DNA樣品序列的片段與芯片上的DNA探針匹配,并攜帶熒光標(biāo)記。然后,用掃描器對(duì)與樣品作用過(guò)的DNA芯片進(jìn)行掃描檢測(cè)。就可獲得DNA芯片上的熒光點(diǎn)的分布模式,這一分布模式,按四進(jìn)制方式在芯片上進(jìn)行位置編碼。但由于DNA芯片的信息是平行處理,從DNA芯片上測(cè)得的熒光分布模式不能確定與探針匹配的片段在整個(gè)樣品序列中的位置,這樣就必須用遞推的方法。從已知的核苷酸片段開(kāi)始,逐個(gè)片段遞推。由于每個(gè)片段的下一個(gè)遞推片段存在四個(gè)可能性,所以,遞推的結(jié)果不是唯一的。遞推結(jié)果的個(gè)數(shù)取決于探針的長(zhǎng)度和樣品序列的長(zhǎng)度,及樣品序列內(nèi)在的簡(jiǎn)并性。但遞推結(jié)果必有一個(gè)是實(shí)際待測(cè)樣品序列。仿真實(shí)現(xiàn)如下根據(jù)上述序列展開(kāi)及反演技術(shù),采用長(zhǎng)度為11的寡核苷酸序列的ATCG全組合作為DNA芯片的DNA探針。根據(jù)n=4L,則共有4194304個(gè)DNA探針,采用三維立體陣列排列方法,把DNA探針排列如下256(X方向)×256(Y方向)×64(Z方向)制成64塊256×256點(diǎn)陣的DNA探針陣列芯片。用計(jì)算機(jī)仿真了長(zhǎng)度為2~5Kb待測(cè)樣品序列結(jié)果。驗(yàn)證了本發(fā)明的技術(shù)方案。本發(fā)明比現(xiàn)有方法具有實(shí)質(zhì)性特點(diǎn)和顯著進(jìn)步,本發(fā)明具有明顯的優(yōu)點(diǎn)。如1.操作簡(jiǎn)單。該方法只需簡(jiǎn)單的分子雜交、DNA片段連接操作,其余的工作都是用掃描儀和計(jì)算機(jī)完成。
2.節(jié)省時(shí)間。分子雜交和DNA片段連接所需的條件很變通,一個(gè)人可以同時(shí)操作很多樣品。而掃描所需的時(shí)間只需幾分鐘完成。樣品序列的逆推反演完全由計(jì)算機(jī)完成。在133MHz個(gè)人計(jì)算機(jī)上應(yīng)用本發(fā)明方案所給出的逆推反演技術(shù),可以在1~2小時(shí)內(nèi)給出結(jié)果。
3.信息量大。長(zhǎng)度為L(zhǎng)xy+nz的寡核苷酸種類(lèi)是4Lxy+nz種。當(dāng)Lxy+nz=11時(shí),可較快地測(cè)定出5Kb左右的序列。而常規(guī)的DNA分析方法一次只能確定1Kb左右DNA序列。
4.節(jié)省費(fèi)用。大量芯片的使用將使芯片的價(jià)格大幅度降低。由于芯片一次性可以確定較長(zhǎng)片段的核苷酸序列,因此平均單個(gè)核苷酸所需的費(fèi)用就會(huì)大大降低。
權(quán)利要求
1.一種測(cè)定DNA序列的方法,其特征在于將A、C、G、T構(gòu)成的長(zhǎng)度為L(zhǎng)的全組合寡核苷酸片段固定于DNA芯片上,序列待測(cè)的DNA片段是熒光標(biāo)記的一組長(zhǎng)度為L(zhǎng),待連接點(diǎn)處的nz個(gè)核苷酸是已知的隨機(jī)片段,同時(shí)與DNA芯片一起保溫,進(jìn)行DNA配對(duì),與待測(cè)DNA序列配對(duì)的寡核苷酸片段被連接起來(lái),反應(yīng)后清洗DNA芯片,然后用掃描儀檢測(cè),可以獲得待測(cè)DNA片段的各種匹配片段序列出現(xiàn)的頻率,根據(jù)這種頻率可以反推出待測(cè)DNA片段的核苷酸序列。
2.根據(jù)權(quán)利要求1所述的測(cè)定DNA序列方法,其特征還在于芯片的總寡核苷酸探針點(diǎn)數(shù)n=4Lxy,在一個(gè)二維構(gòu)成的芯片平面,可以在X、Y軸上各選擇4nx,4ny個(gè)點(diǎn),并滿(mǎn)足下列條件4nx×4ny=4Lxy,DNA芯片就可實(shí)現(xiàn)序列展開(kāi)和反演。
全文摘要
本發(fā)明將A、C、G、T構(gòu)成的長(zhǎng)度為L(zhǎng)的全組合寡核苷酸片段固定于DNA芯片上,序列待測(cè)的DNA片段是熒光標(biāo)記的一組長(zhǎng)度為L(zhǎng),待連接點(diǎn)處的nz個(gè)核苷酸是己知的隨機(jī)片段,同時(shí)與DNA芯片一起保溫,進(jìn)行DNA配對(duì),與待測(cè)DNA序列配對(duì)的寡核苷酸片段被連接起來(lái),反應(yīng)后清洗DNA芯片,然后用掃描儀檢測(cè),可以獲得待測(cè)DNA片段的各種匹配片段序列出現(xiàn)的頻率,根據(jù)這種頻率可以反推出待測(cè)DNA片段的核苷酸序列。
文檔編號(hào)C12Q1/68GK1272551SQ0011538
公開(kāi)日2000年11月8日 申請(qǐng)日期2000年4月13日 優(yōu)先權(quán)日2000年4月13日
發(fā)明者王慶康, 劉建華, 林志新, 劉燕剛 申請(qǐng)人:上海交通大學(xué)