專利名稱:一種基于pcr的低成本、簡(jiǎn)單、高效的snp檢測(cè)方法
一種基于PCR的低成本、簡(jiǎn)單、高效的SNP檢測(cè)方法專利領(lǐng)域本發(fā)明屬于生物技術(shù),涉及遺傳學(xué)檢測(cè)領(lǐng)域。
背景技術(shù):
近年來(lái),隨著大規(guī)模DNA(脫氧核糖核酸)測(cè)序技術(shù)的迅速發(fā)展,科學(xué)家已經(jīng)能夠廣泛了解重要的DNA區(qū)域的編碼,并研究不同人的個(gè)體之間的DNA差異;遺傳學(xué)家利用這些手段和數(shù)據(jù)做了大量研究,成功地找到了許多人的遺傳多樣性與疾病或其他性狀的聯(lián)系??茖W(xué)家研究最多的遺傳標(biāo)記是單核苷酸多態(tài)性(SNP),即同一物種的不同個(gè)體在基因組 DNA某一單核苷酸位點(diǎn)上的差異。SNP有廣泛的用途。SNP對(duì)疾病產(chǎn)生的機(jī)制有影響,也對(duì)個(gè)體對(duì)藥物,病原體,疫苗的反應(yīng)有影響。類似的,SNP在別的生物學(xué)領(lǐng)域,比如對(duì)于莊稼和牲畜的培育都有重要作用。由于SNP在科學(xué)研究和應(yīng)用上的價(jià)值,已經(jīng)涌現(xiàn)出多種SNP分型(檢測(cè))的技術(shù) (參考資料1)。下面對(duì)主要的技術(shù)進(jìn)行分類介紹。1.測(cè)序。最常見的方式是對(duì)包括該SNP的周邊區(qū)域的DNA進(jìn)行測(cè)序。這種方法較為直接可靠,被很多遺傳學(xué)科研實(shí)驗(yàn)室采用。其缺點(diǎn)是需要昂貴的測(cè)序設(shè)備,費(fèi)用高,通量低速度慢。2.限制性內(nèi)切酶長(zhǎng)度多樣性(RFLP)。這是最早最簡(jiǎn)單的一種檢測(cè)方法。限制性內(nèi)切酶有很多種,每種都能以很高的親合力與特異的DNA限制性位點(diǎn)結(jié)合并切斷DNA。在使用多種限制性內(nèi)切酶對(duì)基因組DNA進(jìn)行消化后,再用凝膠電泳檢測(cè)片斷大小,就有可能知道內(nèi)切酶是否切斷了一個(gè)預(yù)期的限制性位點(diǎn)。如果沒有切斷,則膠電泳檢測(cè)不到那個(gè)預(yù)期大小的片斷,則表明該位點(diǎn)(SNP)有不同的核苷酸。然而,由于真核生物基因組的復(fù)雜性及這種方法針對(duì)不同位點(diǎn)需要特定內(nèi)切酶的特性,該方法一個(gè)反應(yīng)往往只能做一個(gè)位點(diǎn),無(wú)法增加通量。3. PCR方法。針對(duì)SNP的不同的等位基因設(shè)計(jì)不同引物對(duì)該位點(diǎn)進(jìn)行PCR擴(kuò)增。 這些引物與SNP周邊的序列配對(duì),但每種只與SNP上的一個(gè)等位基因配對(duì)。每種不同的引物只擴(kuò)增出與之對(duì)應(yīng)的SNP等位基因型。兩種引物得到的產(chǎn)物片段大小有一定的差異,因此可以通過檢測(cè)區(qū)分。PCR方法簡(jiǎn)單,設(shè)備需要小,較為經(jīng)濟(jì),但設(shè)計(jì)出特異性好又能高效多重化的引物則有較大難度,并且實(shí)驗(yàn)經(jīng)常需要摸索條件,因而也不容易做高通量的檢測(cè)。4.翻轉(zhuǎn)內(nèi)切酶法(Flap-endonuclease,或FEN)。兩個(gè)不同的寡聚核苷酸探針與一個(gè)SNP相結(jié)合,形成一定的結(jié)構(gòu),然后一種內(nèi)切酶識(shí)別這個(gè)結(jié)構(gòu)并將DNA切斷。其中,第一個(gè)探針與SNP的3’端DNA結(jié)合,第二個(gè)探針與特定的SNP等位基因結(jié)合。通過使用不同的第二探針,就可以檢測(cè)不同的SNP等位基因型。這里,DNA切割可以用熒光共震能量轉(zhuǎn)移 (fluorescence resonanceenergy transfer,或FRET)系統(tǒng)來(lái)探測(cè)。該方法的靈敏度和特異性都較好,但目前也只能一次做單個(gè)SNP的檢測(cè)。5.引物延伸法。這種方法有兩個(gè)步驟。首先,特異的探針與SNP位點(diǎn)的直接上游結(jié)合。然后,DNA多聚酶將探針的DNA延伸,使之含有該SNP的核苷酸。SNP的不同等位基因
3可以通過熒光標(biāo)記檢測(cè)。一種常用的方法是在反應(yīng)中加入帶有不同熒光標(biāo)記的雙脫氧核苷酸(ddNTP),在引物與SNP上游結(jié)合后讓其延伸單個(gè)堿基,然后通過檢測(cè)加上的不同ddNTP 的熒光,就可以知道這個(gè)SNP的等位基因是哪個(gè)。Seauenom' s iPLEX系統(tǒng)采用了這種方法,并用質(zhì)譜儀來(lái)檢測(cè)。該方法適合用來(lái)檢測(cè)中等數(shù)目(小于40)的SNP,但需要較昂貴的專門儀器。Illumina的hfinium系統(tǒng)也是基于這類方法,但它使用了抗體檢測(cè)。該方法可以做超過10000個(gè)SNP的檢測(cè),適合全基因組掃描,但是價(jià)格較貴。APEX-2方法則將引物延伸法與基因芯片技術(shù)結(jié)合起來(lái),也能達(dá)到高通量。6. 5’ -核酸酶法。TaqMan檢測(cè)法利用了 Taq DNA多聚酶的5’核酸酶活性。這種方法用5’和3’端的PCR引物來(lái)擴(kuò)增含SNP的區(qū)域,再用FRET系統(tǒng)結(jié)合兩個(gè)特異的DNA探針來(lái)區(qū)分不同的等位基因。這些探針在5’端有熒光基團(tuán),3’端有熄滅基團(tuán),因此在探針完整時(shí)不產(chǎn)生熒光。在PCR過程中,如果該探針序列與SNP特異配對(duì),則可以與目標(biāo)DNA完美結(jié)合,然后Taq酶在進(jìn)行DNA擴(kuò)增時(shí)就可以將探針的5’端降解,熒光基團(tuán)就游離出來(lái)并發(fā)光。如果該探針序列與SNP不特異配對(duì),則與目標(biāo)DNA不能完美結(jié)合,5’核酸酶活性就無(wú)法使探針的5’端降解。TaqMan法可以用來(lái)檢測(cè)最多7個(gè)SNP。如果在一塊板上同時(shí)進(jìn)行多個(gè)反應(yīng),可以達(dá)到很高的通量。7. SNP基因芯片。高密度寡聚核苷酸SNP芯片可以在一個(gè)小的芯片上排列幾十萬(wàn)個(gè)探針,使得大量的SNP可以同時(shí)檢測(cè)。由于SNP的等位基因只相差一個(gè)核苷酸,要讓芯片上所有探針的雜交條件都達(dá)到最優(yōu)化是有難度的。這個(gè)問題在一定程度上可以通過對(duì)一個(gè) SNP重復(fù)性地選取幾個(gè)探針來(lái)解決。在這些重復(fù)性的探針上,SNP處于不同的位置,并且有些探針與SNP等位基因是錯(cuò)誤配對(duì)的。通過比較目標(biāo)DNA與這些重復(fù)性探針的雜交強(qiáng)度,就有可能判定特異的純合或雜合的SNP等位基因。相對(duì)來(lái)講,SNP基因芯片的靈敏度和特異性都較低,但是,由于其超大規(guī)模的特性,對(duì)于全基因組掃描它有非常大的優(yōu)勢(shì)。Affymetrix 公司的GeneChip是個(gè)廣泛使用的SNP基因芯片,它可以檢測(cè)超過50萬(wàn)的SNP。8.基于DNA物理性質(zhì)的方法。這些方法包括單鏈構(gòu)象多態(tài)性,溫度梯度膠電泳,變性高效液相色譜法(DHPLC)等。這些方法可以達(dá)到很好的特異性,但是都需要高度優(yōu)化的實(shí)驗(yàn)條件,也很難提高通量。在現(xiàn)有的方法中,基因芯片、hfinium等大規(guī)模方法可同時(shí)檢測(cè)成千上萬(wàn)的SNP, 但是成本較高且需要特殊設(shè)備。比如說(shuō),一個(gè)基因芯片至少要幾百美元,但至多只能用來(lái)做少數(shù)幾次檢測(cè)。這些方法適合全基因組SNP掃描。但是,如果在一個(gè)小成本實(shí)驗(yàn)室,科研人員只是對(duì)一小組SNP (比如,10到20個(gè))感興趣,這些方法則顯得昂貴且不合適。其他的方法,比如測(cè)序,RFLP, FEN等,雖然簡(jiǎn)單經(jīng)濟(jì),但主要適合做單個(gè)SNP檢測(cè),用來(lái)檢測(cè)多個(gè)SNP 效率很低。用多重PCR來(lái)檢測(cè)多個(gè)SNP,會(huì)遇到引物相互干擾,非特異性擴(kuò)增,引物與基因組別處匹配等難題;并且一旦PCR產(chǎn)物種類一多,區(qū)分它們就有難度,如果用熒光標(biāo)記引物或毛細(xì)管電泳來(lái)檢測(cè),就需要特別設(shè)備,檢測(cè)成本就大大上升。因此,如果科研人員知道數(shù)目不大的一組SNP與某個(gè)性狀或疾病相關(guān),并想尋找一種快捷又成本非常低的方法來(lái)檢測(cè)這組SNP,就很難找到合適的方法。本發(fā)明設(shè)計(jì)了一種新的基于多重PCR的方法,用一整套的生物信息學(xué)方法來(lái)輔助實(shí)驗(yàn)設(shè)計(jì),能夠迅速找到最優(yōu)化的一套引物和實(shí)驗(yàn)設(shè)計(jì)方案,從而能使用簡(jiǎn)單方法特異地、高效地分辨多個(gè)SNP,因此提供了檢測(cè)一組SNP的一種低成本、簡(jiǎn)單、有效的檢測(cè)方法。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用來(lái)檢測(cè)一組SNP的低成本,簡(jiǎn)單、效率高的檢測(cè)方法; 該方法能一次檢測(cè)多個(gè)SNP,檢測(cè)效率高、特異性好,并且只需簡(jiǎn)單的分子生物學(xué)設(shè)備。本發(fā)明是一種基于PCR的方法,主要特點(diǎn)是采用多對(duì)針對(duì)不同SNP等位基因的特異性引物進(jìn)行多重PCR擴(kuò)增;通過一種算法找到使檢測(cè)SNP的數(shù)目最大的PCR產(chǎn)物長(zhǎng)度分配方案,以及用生物信息學(xué)的方法尋找最優(yōu)引物設(shè)計(jì)來(lái)消除引物的相互干擾和非特異性擴(kuò)增;最終,多個(gè)SNP的不同等位基因都可以通過簡(jiǎn)單檢測(cè)PCR產(chǎn)物長(zhǎng)度清楚地、特異地區(qū)分開。我們實(shí)驗(yàn)設(shè)計(jì)的算法既考慮了結(jié)果的完全性,又對(duì)運(yùn)行時(shí)間作了很好的控制。這個(gè)算法可以編寫計(jì)算機(jī)程序來(lái)實(shí)現(xiàn),從而使實(shí)驗(yàn)設(shè)計(jì)快速準(zhǔn)確。此方法適合同時(shí)檢測(cè)一組數(shù)目不大(小于20)的SNP。本發(fā)明的目的是通過以下的具體方法和步驟來(lái)實(shí)現(xiàn)的。PCR檢測(cè)SNP原理本發(fā)明采用的PCR方法需要兩對(duì)引物。弓丨物1(中心引物)的 3’端與DNA的A鏈的SNP的一個(gè)等位基因配對(duì),引物2 (側(cè)端引物)與A鏈下游的序列配對(duì),引物1和2可以從帶有這個(gè)SNP等位基因的DNA特異擴(kuò)增出一個(gè)長(zhǎng)度為a的片段。引物 3 (中心引物)的3’端與DNA的B鏈中SNP的另一個(gè)等位基因配對(duì),引物4 (側(cè)端引物)與 B鏈下游的序列配對(duì),這樣,引物3和4可以從帶有此SNP另一個(gè)等位基因的DNA擴(kuò)增出長(zhǎng)度為b的片段。中心引物1和3與特異的SNP等位基因配對(duì)。側(cè)端引物2與4則不管SNP 的等位基因是什么,都可以擴(kuò)增出長(zhǎng)度為a+b的片段。這個(gè)片段可以作為陽(yáng)性對(duì)照。這樣, 通過檢測(cè)PCR產(chǎn)物的長(zhǎng)度就可以知道此SNP的基因型。如果a和b兩個(gè)片段都出現(xiàn),則模板DNA是雜合基因型。窮盡搜索非特異性擴(kuò)增目前,人們?cè)谧饕锱c目標(biāo)DNA的比較時(shí),一般使用 BLAST。然而,BLAST是一種經(jīng)驗(yàn)算法,在比較短DNA序列時(shí)往往不能找全所有的配對(duì)序列。由于引物序列都較短,因此BLAST就不是對(duì)此最合適的方法。這里應(yīng)當(dāng)使用能把所有匹配序列都找到的“窮盡的序列比較方法”。本發(fā)明使用了一種窮盡的序列比較方法 TAGSCAN(參考資料2),可以迅速找到所有的配對(duì)的短片段DNA。在本發(fā)明方法的第二步中, 采用了這種方法來(lái)尋找所有的非特異性擴(kuò)增,步驟如下。首先根據(jù)退火溫度確定最小匹配區(qū)段長(zhǎng)度R及最大錯(cuò)配數(shù)目E。將一個(gè)長(zhǎng)度為R的窗口在第一個(gè)引物序列上從頭到尾移動(dòng), 每次移動(dòng)一個(gè)核苷酸,并且每次將窗口中DNA片段的序列及最大錯(cuò)配數(shù)目E輸入到TAGSCAN 中,尋找在目標(biāo)基因組中匹配的所有位置,將在所有窗口找到的匹配位置匯總到P = (P1, P2,……Py+Py)。同樣的,找到第二個(gè)引物在基因組上匹配的所有位置Q= ( , ,…… qx-!, qx)。將P中的每個(gè)位置與Q中的每個(gè)位置相比較,對(duì)于任何一個(gè)組合Pi和%,如果它們?cè)谕粋€(gè)染色體上并且距離小于最大檢測(cè)長(zhǎng)度L,則Pi和Qj之間的DNA區(qū)段是這對(duì)引物的一個(gè)非特異性擴(kuò)增。在比較過所有位置后,所有可能檢測(cè)到的非特異性擴(kuò)增片段就找到了。本發(fā)明的操作步驟如下第一步,確定PCR產(chǎn)物長(zhǎng)度分配;根據(jù)檢測(cè)DNA(PCR產(chǎn)物)的設(shè)備手段的特性,推導(dǎo)出使用這種手段能檢測(cè)到最多SNP的方案。在進(jìn)行具體實(shí)驗(yàn)設(shè)計(jì)之前,需要確定用來(lái)分辨PCR產(chǎn)物的儀器手段(比如,凝膠電泳)。根據(jù)所使用的手段檢測(cè)DNA的長(zhǎng)度范圍和分辨率(長(zhǎng)度差),就可以知道它至多可以分辨出幾種不同長(zhǎng)度的DNA。假設(shè)可以檢測(cè)DNA長(zhǎng)度范圍是(0,L)個(gè)堿基對(duì),分辨率是 S個(gè)堿基對(duì),則至多可以分辨N = L/S個(gè)不同PCR產(chǎn)物。在不同的長(zhǎng)度范圍內(nèi),分辨率S可能是不同的,這點(diǎn)要考慮到。在本發(fā)明中,每個(gè)SNP可能有三種不同的PCR產(chǎn)物a、b、和c, 其中他們的長(zhǎng)度a+b = c。本發(fā)明的第一步,就是通過以下的算法,找到一種SNP的PCR產(chǎn)物長(zhǎng)度的組合,使得能盡量利用DNA檢測(cè)手段所提供的長(zhǎng)度空間,從而能分辨盡可能多的 SNP。由于每個(gè)SNP的PCR產(chǎn)物a、b、c的長(zhǎng)度可以靈活變動(dòng),這個(gè)問題抽象后就是如果有一個(gè)數(shù)列1,2,…,N_1,N,每個(gè)SNP從此數(shù)列中抽取三個(gè)不同的數(shù)a、b、c, 使得a+b = c ;每個(gè)SNP抽取的數(shù)不能相同;要找到一個(gè)抽取數(shù)字的方式,使得盡可能多的 SNP能抽到數(shù)。本發(fā)明的算法是從數(shù)列的兩端(靠近1和N)及從數(shù)列的中心點(diǎn)附近輪流取數(shù),一個(gè)SNP接著一個(gè)SNP地取。流程如下1)為第一個(gè) SNP (a、b、c)抽取 1、N_1、和 N。2)確定一個(gè)中心數(shù)M。第二個(gè)SNP抽取N-2-M、M和N-2。若N是奇數(shù),M = N/2 ; 若是偶數(shù),Μ = Ν/2+1。3)第3個(gè)SNP取數(shù)方式類似第1步,但a = 2,取出數(shù)為2、N_5、N-3 ;第4個(gè)SNP 則照第2步的取法,但b = M+1,取出數(shù)為Ν-5-Μ、Μ+1和N-4。如此輪流地取數(shù),c的值逐步下降。如果a、b或c的預(yù)期數(shù)值已被取出,則取下一個(gè)可能的數(shù)字組合。這樣往下執(zhí)行,直到照第2步取數(shù)方式已無(wú)法取到數(shù)。4)這時(shí),只照第1步的方式取數(shù),c的值繼續(xù)逐步下降,直到剩下的數(shù)中沒有三個(gè)數(shù)能使a+b = c成立。本算法的好處是從兩端和從中間輪流取數(shù),使得數(shù)列的每個(gè)區(qū)段都能被抽到,基本上使所有的數(shù)都不會(huì)被浪費(fèi)。用本算法對(duì)一些數(shù)列做了試驗(yàn),效果良好。對(duì)很多數(shù)列都達(dá)到了最佳效果,比如,N = 15,16或17時(shí),理論上最多只能容納15/3 = 5套SNP(a、b、c)的數(shù)字組合,用本算法得出的抽取方式能得到5個(gè)SNP,達(dá)到了最理想的數(shù)目。當(dāng)N=沈時(shí), 理論上最多只能容納8套SNP,本算法也能得到8個(gè)SNP。在最差的情況下,本算法得出的抽數(shù)方式也能至少得到N/3-1個(gè)SNP(比最理想值少1個(gè))。在為每個(gè)SNP得到一個(gè)(a,b, c)數(shù)組后,其PCR產(chǎn)物的長(zhǎng)度就是aXS、bXS、cXS,其中S為分辨率。因此,通過這個(gè)算法的計(jì)算,我們可以找到一種效率最高的PCR產(chǎn)物的長(zhǎng)度分配方案,使得一次能檢測(cè)盡量多的SNP。而這個(gè)方案中的PCR產(chǎn)物長(zhǎng)度將用來(lái)直接指導(dǎo)下面的引物設(shè)計(jì)。第二步,按照以下流程/算法進(jìn)行所有PCR引物設(shè)計(jì)及優(yōu)化;這里綜合考慮第一步得出的引物長(zhǎng)度,目標(biāo)基因組序列,及DNA結(jié)合的熱動(dòng)力學(xué),并使用了一種窮盡搜索的方法來(lái)尋找非特異性擴(kuò)增,因此設(shè)計(jì)出的一套引物能檢測(cè)盡量多的SNP,并能盡量降低PCR中非特異性擴(kuò)增和引物二聚體形成。檢測(cè)的效率和準(zhǔn)確性都得以優(yōu)化。假定要檢測(cè)η個(gè)SNP =SNP1, SNP2,……,SNPlri,SNPn,而且在前面步驟中已得到了 h個(gè)SNP的PCR產(chǎn)物長(zhǎng)度分配方案,h彡n,通過以下步驟可以完成所有SNP的引物優(yōu)化設(shè)計(jì)。先從SNP1開始(i = 1),進(jìn)行下面循環(huán)(直到設(shè)計(jì)好所有SNP的引物,即i = η), 每次為一個(gè)SNP (SNPi)設(shè)計(jì)引物,。預(yù)期的退火溫度為Tm。
1)從前面得到的PCR產(chǎn)物的長(zhǎng)度分配方案中,為SNPi選取一套產(chǎn)物長(zhǎng)度(a、b、c), 使得a+b = c。根據(jù)基因組在SNPi周邊的序列及這兩個(gè)PCR產(chǎn)物的長(zhǎng)度(a、b),還有退火溫度范圍、GC比例等參數(shù),進(jìn)行PCR引物設(shè)計(jì)(參考資料3和4)。引物2在引物1下游a 個(gè)核苷酸附近的位置,也就是說(shuō)產(chǎn)物長(zhǎng)度約為a。同樣,引物4在引物3下游b個(gè)核苷酸附近的位置。2)將新設(shè)計(jì)的引物序列與前面已經(jīng)設(shè)計(jì)的引物序列進(jìn)行一一比較,主要看看引物之間是否會(huì)形成交叉二聚體。判斷標(biāo)準(zhǔn)是靠近3’端的交叉二聚體的AG彡-5kCal/mol,引物中間區(qū)域的交叉二聚體的AG彡-6kcal/m0l。AG = ΔΗ_Τ Δ S,計(jì)算方法可參照文獻(xiàn)2 和3。a)如果SNPi的側(cè)端引物2或4與別的引物形成二聚體,則回到第1步,將SNPi的側(cè)端引物2或4的位置做變動(dòng),來(lái)消除這些二聚體。b)如果是SNPi的中心引物1或3與另一個(gè)SNPk的側(cè)端引物2或4形成二聚體, 則將SNPk的原有引物設(shè)計(jì)清除,再把SNPk移至SNP列表的最后,即在后面再對(duì)SNPk重新進(jìn)行引物設(shè)計(jì)。c)如果SNPi的中心引物1或3與另一個(gè)SNPk的中心引物1或3形成二聚體,將 SNPi中心引物1或3的長(zhǎng)度做些調(diào)整,使形成二聚體的AG值達(dá)到最高。同時(shí),對(duì)此作記錄,在后面的實(shí)驗(yàn)中需要觀察,如果這個(gè)二聚體使檢測(cè)效率非常差,則可以將SNPi移到一個(gè)分開的反應(yīng)。3)將新設(shè)計(jì)的引物序列與前面已經(jīng)設(shè)計(jì)的引物序列一一配對(duì)與基因組進(jìn)行比對(duì), 看是否有非特異性擴(kuò)增。這里使用了一種窮盡的序列比較方法(參見前面的“窮盡尋找非特異性擴(kuò)增”部分),來(lái)迅速地在目標(biāo)DNA序列中找到所有的與引物可能配對(duì)的短片段,并據(jù)此找到可能的長(zhǎng)度小于最大檢測(cè)長(zhǎng)度L的非特異性擴(kuò)增。如果擴(kuò)增片段長(zhǎng)度大于L,將不會(huì)對(duì)檢測(cè)造成干擾。a)如果SNPi的側(cè)端引物2或4與別的引物配對(duì)導(dǎo)致非特異性擴(kuò)增,則回到第1步, 將SNPi的側(cè)端引物2或4的位置做變動(dòng),來(lái)消除這些非特異性擴(kuò)增。b)如果是SNPi的中心引物1或3與另一個(gè)引物SNPk的側(cè)端引物2或4配對(duì)產(chǎn)生非特異擴(kuò)增,則將SNPk的原有引物設(shè)計(jì)清除,再把SNPk移至SNP列表的最后,即在后面再對(duì) SNPk重新進(jìn)行引物設(shè)計(jì)。c)如果SNPi的中心引物1或3與另一個(gè)SNPk的中心引物1或3配對(duì)產(chǎn)生非特異性擴(kuò)增,可將SNPi中心引物1或3的長(zhǎng)度做些調(diào)整,使引物非特異性結(jié)合的區(qū)域變小,看是否可以消除非特異性擴(kuò)增。d)如果步驟a、b或c中無(wú)法消除非特異性擴(kuò)增,則停止循環(huán),增加引物長(zhǎng)度和退火溫度,從頭開始引物設(shè)計(jì)。同時(shí),對(duì)此作記錄,在實(shí)驗(yàn)中觀察是否該特異性擴(kuò)增可以通過控制反應(yīng)條件來(lái)消除;如果不能,則將SNPi移到一個(gè)分開的反應(yīng)。第三步,使用設(shè)計(jì)好的引物對(duì)樣本DNA進(jìn)行PCR反應(yīng),PCR產(chǎn)物用預(yù)定的DNA檢測(cè)設(shè)備進(jìn)行分辨,每一個(gè)預(yù)期的PCR產(chǎn)物長(zhǎng)度就代表一個(gè)SNP的一種基因型。因此,一個(gè)反應(yīng)就可分析一個(gè)樣本的多個(gè)SNP。有些情況下,特別是在引物設(shè)計(jì)時(shí)發(fā)現(xiàn)了有產(chǎn)生引物二聚體或非特異性擴(kuò)增的可能性的情況下,需要對(duì)PCR的反應(yīng)條件進(jìn)行優(yōu)化??梢栽O(shè)計(jì)一組dNTP, MgCl和引物的濃度梯度實(shí)驗(yàn),尋找最優(yōu)的反應(yīng)條件。如果還不能很好消除引物二聚體或非特異性擴(kuò)增的不良影響,則可以將導(dǎo)致問題的SNP(參見引物設(shè)計(jì)步驟)從這個(gè)反應(yīng)中分離出去,或換成別的SNP,再重新進(jìn)行第二步的引物設(shè)計(jì)。本發(fā)明提供了一種檢測(cè)一組SNP的一種低成本、簡(jiǎn)單、效率高的檢測(cè)方法。本發(fā)明用生物信息學(xué)算法輔助實(shí)驗(yàn)設(shè)計(jì),充分利用了 DNA檢測(cè)手段的檢測(cè)空間,并考慮所有的非特異性擴(kuò)增和引物相互干擾的情況,使多重PCR的效率和可靠性得到最大化;因而克服了現(xiàn)有PCR方法的非特異性擴(kuò)增和難以簡(jiǎn)單高效地多重化等困難。而與現(xiàn)有的基因芯片, ^finium等價(jià)格貴并且需要特別設(shè)備的大規(guī)模檢測(cè)方法相比,本發(fā)明只需要基本的分子生物學(xué)設(shè)備,不需要任何其他特殊檢測(cè)設(shè)備,因此具有非常低的成本;對(duì)于針對(duì)一組數(shù)目不大的SNP的低成本的檢測(cè)需要,本發(fā)明的方法具有優(yōu)越性。
具體實(shí)施方案 本發(fā)明的方法適合同時(shí)檢測(cè)一組數(shù)目不大(小于20)的SNP。因此,首先要選取與檢測(cè)目的最相關(guān)的關(guān)鍵SNP,比如非常明確的與某種疾病直接相關(guān)的SNP。如果想大規(guī)模分析大范圍的SNP,則不適宜用本方法。在本發(fā)明的方法中,用凝膠電泳檢測(cè)PCR產(chǎn)物的DNA長(zhǎng)度是一種比較合適的手段。 當(dāng)然,也可以使用別的手段來(lái)檢測(cè)DNA長(zhǎng)度。不同濃度的凝膠電泳具有不同的檢測(cè)長(zhǎng)度范圍和分辨率,在實(shí)際應(yīng)用中可以進(jìn)行選擇。本發(fā)明的算法可以用計(jì)算機(jī)軟件程序來(lái)實(shí)現(xiàn),從而使實(shí)驗(yàn)設(shè)計(jì)變得操作簡(jiǎn)便并且高效。這個(gè)軟件包括三個(gè)模塊1)用于確定PCR產(chǎn)物長(zhǎng)度分配方案的程序;2)用于在基因組上窮盡地尋找非特異性擴(kuò)增的程序;3)根據(jù)預(yù)定的PCR 產(chǎn)物長(zhǎng)度和基因組序列尋找最優(yōu)化的引物設(shè)計(jì)的程序。這三個(gè)程序基于在發(fā)明內(nèi)容中所述的相對(duì)應(yīng)的算法,其中第3個(gè)模塊(優(yōu)化引物設(shè)計(jì)的模塊)使用了第2個(gè)模塊(窮盡尋找非特異性擴(kuò)增的程序)。這些程序可以用不同的計(jì)算機(jī)語(yǔ)言來(lái)實(shí)現(xiàn),并建立用戶界面來(lái)輔助使用。以下是本專利的一個(gè)典型的實(shí)施例。假設(shè)我們知道有5個(gè)SNP與某種疾病的發(fā)病密切相關(guān)。我們采用2%凝膠電泳,其檢測(cè)的DNA長(zhǎng)度范圍是800個(gè)核苷酸以下,并可以清楚分辨40個(gè)核苷酸的差別,在中心區(qū)域的分辨率還可以更高。使用這種手段可以比較輕松地檢測(cè)到15種不同長(zhǎng)度的PCR產(chǎn)物。 首先,用前面所述的設(shè)計(jì)PCR產(chǎn)物長(zhǎng)度分配方案的程序,得到以下結(jié)果(表1)。
權(quán)利要求
1.一種基于PCR的用于檢測(cè)SNP的方法,其特征在于,a)每個(gè)SNP的每個(gè)等位基因都有一個(gè)特異的引物和相對(duì)應(yīng)的長(zhǎng)度唯一的PCR產(chǎn)物;b)針對(duì)檢測(cè)中采用的DNA檢測(cè)手段的特性,尋找一種優(yōu)化的PCR產(chǎn)物長(zhǎng)度分配方案,以增大檢測(cè)SNP的數(shù)目;c)根據(jù)設(shè)計(jì)的PCR 產(chǎn)物長(zhǎng)度分配方案及待測(cè)SNP,按一定算法,逐個(gè)地設(shè)計(jì)和優(yōu)化所有SNP的PCR引物。
2.根據(jù)權(quán)利要求1所述方法,其特征在于,每個(gè)SNP有兩對(duì)特異引物,引物1(中心引物)的3’端與DNA的A鏈的SNP的一個(gè)等位基因χ配對(duì),引物2 (側(cè)端引物)與A鏈下游的序列配對(duì);引物3 (中心引物)的3’端與DNA的B鏈的SNP的另一個(gè)等位基因y配對(duì),引物4 (側(cè)端引物)與B鏈下游的序列配對(duì);引物1和2可以從帶有等位基因χ的DNA擴(kuò)增出長(zhǎng)度為a的片段,引物3和4可以從帶有等位基因y的DNA擴(kuò)增出長(zhǎng)度為b的片段,a不等于b。
3.根據(jù)權(quán)利要求1或2所述方法,其特征在于,利用一種算法找到可以檢測(cè)盡量多SNP 的PCR產(chǎn)物長(zhǎng)度分配方案,其步驟如下根據(jù)可檢測(cè)的DNA長(zhǎng)度范圍(0,L)和分辨率(S),算出可以檢測(cè)的DNA的不同長(zhǎng)度的數(shù)目為N = L/S;將這算法的目的抽象為對(duì)一個(gè)數(shù)列(1,2,…,N-I,N),每個(gè)SNP從此數(shù)列中抽取三個(gè)不同的數(shù)a、b、c,使a+b = c,要找到一個(gè)抽取數(shù)字的方式,使得盡可能多的SNP能抽到數(shù);循環(huán)進(jìn)行以下兩個(gè)取數(shù)步驟,直到取不到合適的數(shù)為止1)從以上數(shù)列的兩端取出3 個(gè)還未被取走的數(shù)a、b、c,使a+b = c,賦給下一個(gè)SNP,2)從數(shù)列的中間點(diǎn)兩側(cè)取出3個(gè)還未被取走數(shù)a、b、c,使a+b = c,賦給再下一個(gè)SNP ;根據(jù)每個(gè)SNP取到的3個(gè)數(shù)a、b、c和分辨率( ,可得出該SNP的3個(gè)產(chǎn)物長(zhǎng)度,即 aXS、bXS、cXS。
4.根據(jù)權(quán)利要求1或2所述方法,其特征在于,在逐個(gè)為每個(gè)SNP設(shè)計(jì)引物時(shí),將新設(shè)計(jì)的引物序列與已經(jīng)設(shè)計(jì)好的引物序列進(jìn)行一一比較,看看引物之間是否會(huì)形成交叉二聚體;如果該SNP的側(cè)端引物與別的引物形成二聚體,則將該SNP的側(cè)端引物的位置做變動(dòng), 來(lái)消除這些二聚體;如果是該SNP的中心引物與另一個(gè)SNP的側(cè)端引物形成二聚體,則將另外那個(gè)SNP移至待設(shè)計(jì)的SNP列表的最后,以待重新設(shè)計(jì)引物。
5.根據(jù)權(quán)利要求1或2所述方法,其特征在于,在逐個(gè)為每個(gè)SNP設(shè)計(jì)引物時(shí),每次將新設(shè)計(jì)的引物序列與前面已經(jīng)設(shè)計(jì)的引物序列一一配對(duì),再使用窮盡的序列比較方法(可以是,但不限于TAGSCAN)與基因組進(jìn)行比較,看是否有長(zhǎng)度小于最大檢測(cè)長(zhǎng)度的非特異性擴(kuò)增;如果該SNP的側(cè)端引物與別的引物配對(duì)導(dǎo)致非特異性擴(kuò)增,則將該SNP的側(cè)端引物的位置做變動(dòng),來(lái)消除這些非特異性擴(kuò)增;如果是該SNP的中心引物與另一個(gè)引物SNP的側(cè)端引物配對(duì)產(chǎn)生非特異擴(kuò)增,則將另外那個(gè)SNP移至待設(shè)計(jì)的SNP列表的最后,以待重新設(shè)計(jì)引物;如果該SNP的中心引物與別的SNP的中心引物配對(duì)產(chǎn)生非特異性擴(kuò)增,則可將該SNP 中心引物的長(zhǎng)度做調(diào)整,以試圖消除非特異性擴(kuò)增;如果無(wú)法通過調(diào)整引物來(lái)消除非特異性擴(kuò)增,則可增加引物長(zhǎng)度和退火溫度,重新設(shè)計(jì)所有引物。
6.由以上方法得出的PCR引物和實(shí)驗(yàn)方案,其特征是,每個(gè)SNP的每個(gè)等位基因?qū)?yīng)一個(gè)唯一的PCR產(chǎn)物長(zhǎng)度,PCR產(chǎn)物長(zhǎng)度分配充分利用了檢測(cè)的空間,引物和實(shí)驗(yàn)設(shè)計(jì)排除了非特異性擴(kuò)增;利用所設(shè)計(jì)引物和實(shí)驗(yàn)方案進(jìn)行單個(gè)PCR反應(yīng),再用實(shí)驗(yàn)方案中指明的手段檢測(cè)產(chǎn)物長(zhǎng)度,就可確定所有SNP的基因型。
全文摘要
本發(fā)明提供了一種基于PCR的低成本,簡(jiǎn)單、高效的SNP檢測(cè)方法;該方法能一次檢測(cè)多個(gè)SNP,檢測(cè)效率高,特異性好。本發(fā)明針對(duì)不同SNP的不同等位基因設(shè)計(jì)長(zhǎng)度特異的引物;通過生物信息學(xué)算法優(yōu)化PCR引物和實(shí)驗(yàn)方案,使得PCR反應(yīng)能夠高效的多重化,并最大程度地消除引物間的相互干擾和非特異性擴(kuò)增;最終,多個(gè)SNP的不同等位基因都可以通過簡(jiǎn)單檢測(cè)PCR產(chǎn)物長(zhǎng)度清楚地、特異地區(qū)分開,因此PCR檢測(cè)的效率和可靠性得到最大化。與現(xiàn)有的基因芯片,Infinium等大規(guī)模檢測(cè)方法相比,本發(fā)明設(shè)備要求簡(jiǎn)單,成本低,對(duì)于針對(duì)一組數(shù)目不大的SNP的低成本的檢測(cè)需要,本發(fā)明的方法具有優(yōu)越性。
文檔編號(hào)G06F19/22GK102191314SQ201010139370
公開日2011年9月21日 申請(qǐng)日期2010年3月12日 優(yōu)先權(quán)日2010年3月12日
發(fā)明者孫朝輝 申請(qǐng)人:孫朝輝