本發(fā)明涉及分子生物學(xué)領(lǐng)域,更具體地說(shuō),涉及一種引物組、錨定引物、文庫(kù)構(gòu)建方法及基因測(cè)序方法。
背景技術(shù):
第二代高通量測(cè)序技術(shù)包括連接測(cè)序法和合成測(cè)序法。其中,所述連接測(cè)序法是基于連接酶在核酸片段之間進(jìn)行連接反應(yīng)的過(guò)程中的保真性來(lái)實(shí)現(xiàn)的,以待測(cè)序核酸片段為模板,錨定引物(又稱(chēng)測(cè)序引物,其與待測(cè)序核酸片段所在鏈互補(bǔ))和寡核苷酸探針(該探針的特定位置上帶有熒光標(biāo)記)進(jìn)行連接反應(yīng),通過(guò)檢測(cè)連接產(chǎn)物上的熒光標(biāo)記從而確定寡核苷酸探針上帶有熒光標(biāo)記的特定位置對(duì)應(yīng)的序列的信息。所述合成測(cè)序法是基于聚合酶在延伸核酸鏈過(guò)程中的保真性來(lái)實(shí)現(xiàn)的,以待測(cè)序核酸片段為模板,錨定引物互補(bǔ)結(jié)合至待測(cè)序核酸片段上,通過(guò)檢測(cè)在延伸過(guò)程中產(chǎn)生的信號(hào)來(lái)確定待測(cè)序核酸片段上相應(yīng)位置的序列信息。第二代高通量測(cè)序技術(shù)因?yàn)槠涓咄亢偷统杀?,目前用于snp分型檢測(cè)。
現(xiàn)有技術(shù)中的一種利用第二代高通量測(cè)序技術(shù)的snp分型方法,包括以下步驟:a、通過(guò)引物擴(kuò)增獲得待測(cè)snp位點(diǎn)的核酸序列;b、基于步驟a的產(chǎn)物構(gòu)建測(cè)序文庫(kù);c、將錨定引物錨定在測(cè)序文庫(kù)分子上,通過(guò)高通量測(cè)序技術(shù)檢測(cè)待測(cè)snp位點(diǎn)的序列信息。為了加快待測(cè)snp位點(diǎn)的檢測(cè),減少測(cè)序的循環(huán)數(shù),提高snp位點(diǎn)檢測(cè)效率,一般將錨定引物設(shè)計(jì)在待測(cè)snp位點(diǎn)的附近。但是這種設(shè)計(jì)方法,往往會(huì)因?yàn)閟np位點(diǎn)所在序列的特殊性,例如該snp位點(diǎn)附近序列存在特殊結(jié)構(gòu)——重復(fù)序列、發(fā)夾情況等,導(dǎo)致按照上述方法設(shè)計(jì)的錨定引物,無(wú)法準(zhǔn)確的錨定在預(yù)定位置,造成測(cè)序結(jié)果不準(zhǔn)確或測(cè)序失敗;使得該方法無(wú)法大規(guī)模推廣。
因此需要一種新的適用范圍廣的引物組、錨定引物、試劑盒、文庫(kù)構(gòu)建及基因測(cè)序方法。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種新的適用范圍廣的引物組、錨定引物、試劑盒、文庫(kù)構(gòu)建及基因測(cè)序方法,旨在解決現(xiàn)有的高通量基因測(cè)序技術(shù)中錨定引物的非特異性錨定的技術(shù)問(wèn)題。
為了實(shí)現(xiàn)發(fā)明目的,本發(fā)明提供了一種引物組,包括第一引物對(duì),所述第一引物對(duì)中的上游引物由第一通用區(qū)和第一互補(bǔ)區(qū)組成;所述第一互補(bǔ)區(qū)與所述第一通用區(qū)的3’末端連接,所述第一互補(bǔ)區(qū)與第一序列完全互補(bǔ);所述第一序列為待測(cè)snp位點(diǎn)所在序列中的一段序列,處于待測(cè)snp位點(diǎn)的3’端,所述第一序列的5’末端距待測(cè)snp位點(diǎn)1至7bp;所述第一通用區(qū)不與第二序列互補(bǔ);所述第二序列為待測(cè)snp位點(diǎn)所在序列上與第一序列的3’末端連接的一段序列。
優(yōu)選的,所述第一互補(bǔ)區(qū)序列長(zhǎng)度在6至12bp之間。
優(yōu)選的,所述第一通用區(qū)序列長(zhǎng)度在6至16bp之間。
優(yōu)選的,所述第一序列的5’末端距待測(cè)snp位點(diǎn)1至3bp。
優(yōu)選的,所述引物組還包括第二引物對(duì),所述第一引物對(duì)和第二引物對(duì)分別為對(duì)待測(cè)snp位點(diǎn)所在序列進(jìn)行擴(kuò)增的內(nèi)引物對(duì)和外引物對(duì)。
優(yōu)選的,所述第一引物對(duì)中的下游引物由第二通用區(qū)和第二互補(bǔ)區(qū)組成;所述第二互補(bǔ)區(qū)與所述第二通用區(qū)的3’末端連接;所述第二互補(bǔ)區(qū)為待測(cè)snp位點(diǎn)所在序列中的一段序列,處于待測(cè)snp位點(diǎn)的5’端;所述第二通用區(qū)與第三序列不同;所述第三序列為待測(cè)snp位點(diǎn)所在序列上與第二互補(bǔ)區(qū)的5’末端連接的一段序列。
優(yōu)選的,所述第一通用區(qū)中含有u。
為了更好的實(shí)現(xiàn)本發(fā)明的目的,本發(fā)明還提供了一種錨定引物,所述錨定引物與第四序列完全互補(bǔ)配對(duì);所述第四序列為單鏈核酸分子,是上述任一種引物組中的第一引物對(duì)的擴(kuò)增產(chǎn)物中的一段序列;所述第四序列包括第一序列和第一歸一化區(qū),所述第一歸一化區(qū)與第一序列的3’末端連接,所述第四序列的5’末端距待測(cè)snp位點(diǎn)1至7bp;或所述第四序列包括第一互補(bǔ)區(qū)和第二歸一化區(qū),所述第二歸一化區(qū)與第一互補(bǔ)區(qū)的5’末端連接,所述第四序列的3’末端距待測(cè)snp位點(diǎn)1至7bp。
優(yōu)選的,所述第四序列包括第一序列和第一歸一化區(qū),所述第一歸一化區(qū)與第一序列的3’末端連接,所述第一序列的5’末端距待測(cè)snp位點(diǎn)1至3bp;或
所述第四序列包括第一互補(bǔ)區(qū)和第二歸一化區(qū),所述第二歸一化區(qū)與第一互補(bǔ)區(qū)的5’末端連接,所述第四序列的3’末端距待測(cè)snp位點(diǎn)1至3bp。
優(yōu)選的,所述第一互補(bǔ)區(qū)序列長(zhǎng)度在6至12bp之間。
優(yōu)選的,所述第一歸一化區(qū)的長(zhǎng)度在8至14bp之間。
為了更好的實(shí)現(xiàn)本發(fā)明的目的,本發(fā)明還提供了一種試劑盒,包括上述的任一種引物組。
優(yōu)選的,所述試劑盒還包括上述的任一種錨定引物。
為了更好的實(shí)現(xiàn)本發(fā)明的目的,本發(fā)明還提供了另一種試劑盒,包括上述的任一種錨定引物。
優(yōu)選的,所述試劑盒還包括上述的任一種引物組。
為了更好的實(shí)現(xiàn)本發(fā)明的目的,本發(fā)明還提供了一種文庫(kù)構(gòu)建方法,包括以下步驟:
a、利用上述的任一種引物組,對(duì)待測(cè)樣本進(jìn)行pcr擴(kuò)增,得含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物;
b、將含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物與接頭連接,形成待測(cè)序文庫(kù)分子。
優(yōu)選的,所述步驟b為:將含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物直接與接頭連接,形成待測(cè)序文庫(kù)分子,并通過(guò)微球可尋址的固定在固相載體上。
更優(yōu)選的,所述步驟b包括以下步驟:
b1、將含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物直接與固定在微球上的接頭連接,形成固定在微球上的待測(cè)序文庫(kù)分子;
b2、將步驟b1所得微球可尋址的固定在固相載體上。
更優(yōu)選的,所述步驟b1中的連接反應(yīng)是在切割-連接反應(yīng)體系中進(jìn)行的,所述切割-連接反應(yīng)體系包括:連接酶、斷裂劑、固定在微球上的第一接頭和連接緩沖液;所述第一通用區(qū)中含有u;所述斷裂劑用于特異性切割u,并使含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物形成第一粘性末端;所述第一接頭為核酸分子,含有與第一粘性末端完全互補(bǔ)配對(duì)的第二粘性末端。
更優(yōu)選的,步驟b1中所述連接緩沖液中含有peg。
為了更好的實(shí)現(xiàn)本發(fā)明的目的,本發(fā)明還提供了一種基因測(cè)序方法,包括以下步驟:
a、利用上述的任一種引物組,對(duì)待測(cè)樣本進(jìn)行pcr擴(kuò)增,得含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物;
b、將含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物與接頭連接,形成待測(cè)序文庫(kù)分子;
c、利用上述的任一種錨定引物,對(duì)待測(cè)序文庫(kù)分子進(jìn)行測(cè)序,獲得待測(cè)snp位點(diǎn)的序列信息。
優(yōu)選的,所述步驟c中的測(cè)序方法為連接測(cè)序法;所述步驟b、c之間還包括步驟d,采用上述任一種錨定引物,利用無(wú)熒光標(biāo)記的寡核苷酸探針替換有熒光標(biāo)記的寡核苷酸探針,對(duì)待測(cè)序文庫(kù)分子進(jìn)行一次連接測(cè)序反應(yīng)。
優(yōu)選的,所述步驟d包括以下步驟:
d1、將所述錨定引物錨定在待測(cè)序文庫(kù)分子上;
d2、加入無(wú)熒光標(biāo)記的寡核苷酸探針、連接酶以及相應(yīng)的緩沖液,進(jìn)行連接反應(yīng);
d3、變性去除連接產(chǎn)物。
由上可知,本發(fā)明通過(guò)對(duì)待測(cè)snp位點(diǎn)的擴(kuò)增引物進(jìn)行特殊設(shè)計(jì),使得通過(guò)該擴(kuò)增引物擴(kuò)增的產(chǎn)物中的待測(cè)snp位點(diǎn)附近均包括第一通用區(qū),降低不同待測(cè)snp位點(diǎn)附近區(qū)域的復(fù)雜度,然后基于第一通用區(qū)與待測(cè)snp位點(diǎn)之間的序列,可設(shè)計(jì)相應(yīng)的錨定引物,使錨定引物準(zhǔn)確的錨定在目標(biāo)位置,本發(fā)明的引物組、錨定引物、試劑盒、文庫(kù)構(gòu)建及基因測(cè)序方法適用于多種不同的snp位點(diǎn)的檢測(cè),尤其適用于多snp位點(diǎn)的同時(shí)檢測(cè),能在保證snp位點(diǎn)檢測(cè)效率的前提下,避免因?yàn)榇郎y(cè)snp位點(diǎn)附近序列的特殊性而導(dǎo)致的測(cè)序結(jié)果不準(zhǔn)確或測(cè)序失敗現(xiàn)象的出現(xiàn)。
附圖說(shuō)明
圖1是本發(fā)明第一典型實(shí)施例中第一引物對(duì)中的上游引物與待測(cè)snp位點(diǎn)所在序列之間的關(guān)系示意圖。
圖2是本發(fā)明一實(shí)施例中第一引物對(duì)中的下游引物與待測(cè)snp位點(diǎn)所在序列之間的關(guān)系示意圖。
圖3是本發(fā)明第二典型實(shí)施例中的錨定引物與第一引物對(duì)擴(kuò)增產(chǎn)物之間的關(guān)系示意圖。
圖4是本發(fā)明第一具體實(shí)施例中第一接頭的結(jié)構(gòu)示意圖。
圖5是本發(fā)明第一具體實(shí)施例中第一接頭的標(biāo)簽序列與樣本來(lái)源和snp位點(diǎn)的對(duì)應(yīng)關(guān)系圖。
圖6是本發(fā)明第一具體實(shí)施例中實(shí)驗(yàn)組測(cè)序流程圖。
圖7是本發(fā)明第一具體實(shí)施例中第一對(duì)比實(shí)驗(yàn)的測(cè)序流程圖。
圖8是本發(fā)明第一具體實(shí)施例中樣本2的初步實(shí)驗(yàn)結(jié)果對(duì)照?qǐng)D。
圖9是本發(fā)明第三對(duì)比實(shí)驗(yàn)中rs671和rs1801253位點(diǎn)的測(cè)序采圖結(jié)果。
圖10是本發(fā)明第一具體實(shí)施例中rs671和rs1801253位點(diǎn)的測(cè)序采圖結(jié)果。
圖11是本發(fā)明第三對(duì)比實(shí)驗(yàn)中rs1799853位點(diǎn)的測(cè)序采圖結(jié)果。
圖12是本發(fā)明第一具體實(shí)施例中rs1799853位點(diǎn)的測(cè)序采圖結(jié)果。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。
本發(fā)明提出第一典型實(shí)施例,一種引物組,包括第一引物對(duì),如圖1所示,所述第一引物對(duì)中的上游引物由第一通用區(qū)和第一互補(bǔ)區(qū)組成;所述第一互補(bǔ)區(qū)與所述第一通用區(qū)的3’末端連接,所述第一互補(bǔ)區(qū)與第一序列完全互補(bǔ);所述第一序列為待測(cè)snp位點(diǎn)所在序列中的一段序列,處于待測(cè)snp位點(diǎn)的3’端,所述第一序列的5’末端距待測(cè)snp位點(diǎn)1至7bp;所述第一通用區(qū)不與第二序列互補(bǔ);所述第二序列為待測(cè)snp位點(diǎn)所在序列上與第一序列的3’末端連接的一段序列。
需要說(shuō)明的是,所述引物組可用于對(duì)待測(cè)snp位點(diǎn)所在序列進(jìn)行擴(kuò)增,所得擴(kuò)增產(chǎn)物可用于構(gòu)建含待測(cè)snp位點(diǎn)的測(cè)序文庫(kù),進(jìn)而進(jìn)行待測(cè)snp位點(diǎn)的高通量測(cè)序檢測(cè)。本發(fā)明通過(guò)對(duì)第一引物對(duì)中的上游引物的特殊設(shè)計(jì),使得基于第一引物對(duì)的擴(kuò)增產(chǎn)物中,待測(cè)snp位點(diǎn)附近增加了一個(gè)含第一通用區(qū)的序列。所述第一通用區(qū)的序列既不是待測(cè)樣本的模板分子中待測(cè)snp位點(diǎn)附近的序列,也不是待測(cè)樣本的模板分子中待測(cè)snp位點(diǎn)附近的互補(bǔ)序列。所述第一通用區(qū)使得針對(duì)待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物的一端增加了一個(gè)歸一化序列。所述第一通用區(qū)不與第二序列互補(bǔ),無(wú)重復(fù)序列,自身不會(huì)形成發(fā)夾。本方案尤其適用于待測(cè)樣本中的模板分子上的待測(cè)snp位點(diǎn)附近序列結(jié)構(gòu)復(fù)雜的待測(cè)樣本,能夠有效簡(jiǎn)化待測(cè)snp位點(diǎn)附近的序列結(jié)構(gòu),降低錨定引物的設(shè)計(jì)難度,可有效保證錨定引物準(zhǔn)確的錨定在目標(biāo)位置,避免因?yàn)榇郎y(cè)snp位點(diǎn)附近序列的特殊性而導(dǎo)致的測(cè)序結(jié)果不準(zhǔn)確或測(cè)序失敗現(xiàn)象的出現(xiàn),適用于各類(lèi)型待測(cè)snp位點(diǎn)的檢測(cè)。針對(duì)不同的待測(cè)snp位點(diǎn),該第一通用區(qū)序列可相同。
另外,第一序列的5’末端距待測(cè)snp位點(diǎn)1至7bp,使得基于所述第一引物對(duì)擴(kuò)增產(chǎn)物所得待測(cè)序文庫(kù)分子進(jìn)行高通量基因測(cè)序時(shí),錨定引物的末端與待測(cè)snp位點(diǎn)之間的距離在1至7bp之間,當(dāng)利用連接測(cè)序法和t4連接酶進(jìn)行測(cè)序時(shí),可保證僅通過(guò)一次錨定引物與特定位置含熒光標(biāo)記的探針的連接,即可實(shí)現(xiàn)對(duì)待測(cè)snp位點(diǎn)的檢測(cè),提高高通量基因測(cè)序的效率。
在本發(fā)明的一個(gè)實(shí)施例中,所述第一序列的5’末端距待測(cè)snp位點(diǎn)1至3bp。
本方案可有效控制待測(cè)snp位點(diǎn)與第一通用序列之間的間距,使得錨定引物中含有一段足夠長(zhǎng)度的第一通用序列或第一通用序列的互補(bǔ)序列;這在同時(shí)檢測(cè)多個(gè)待測(cè)snp位點(diǎn)時(shí),既保證各錨定引物均能準(zhǔn)確錨定在各自目標(biāo)位置上,又使得各錨定引物與目標(biāo)位置結(jié)合情況更為一致,歸一化,減小因?yàn)楦麇^定引物與目標(biāo)位置結(jié)合情況的差異,從而減小各待測(cè)snp位點(diǎn)檢測(cè)信號(hào)的差異,提高測(cè)序的準(zhǔn)確性。
為了保證利用第一引物對(duì)進(jìn)行擴(kuò)增所得產(chǎn)物的純度,避免非特異性擴(kuò)增,本發(fā)明在第一典型實(shí)施例的基礎(chǔ)上,提出一實(shí)施例,所述第一互補(bǔ)區(qū)序列長(zhǎng)度在6至12bp之間。
本方案保證了第一引物對(duì)中的上游引物與含待測(cè)snp位點(diǎn)的模板序列的特異性集合,避免了非特異性擴(kuò)增,又保證了不同待測(cè)snp位點(diǎn)附近序列之間具有足夠的區(qū)分度。更優(yōu)選的,所述第一互補(bǔ)區(qū)序列長(zhǎng)度在7至10bp之間。
為了進(jìn)一步保證降低了不同待測(cè)snp位點(diǎn)附近區(qū)域的序列復(fù)雜度,本發(fā)明在上述實(shí)施例的基礎(chǔ)上提出另一實(shí)施例,所述第一通用區(qū)序列長(zhǎng)度在6至16bp之間。
本方案中,第一通用序列較大程度的避免了因?yàn)樾蛄羞^(guò)長(zhǎng)或序列過(guò)短導(dǎo)致的第一通用序列內(nèi)部形成二級(jí)結(jié)構(gòu),或第一通用序列與其他序列之間形成二級(jí)結(jié)構(gòu)的可能性,降低了錨定引物的設(shè)計(jì)難度。
在上述任一實(shí)施例的基礎(chǔ)上,本發(fā)明提出另一實(shí)施例,所述引物組還包括第二引物對(duì),所述第一引物對(duì)和第二引物對(duì)分別為對(duì)待測(cè)snp位點(diǎn)所在序列進(jìn)行擴(kuò)增的內(nèi)引物對(duì)和外引物對(duì)。
本方案中,針對(duì)待測(cè)snp位點(diǎn),可利用內(nèi)引物對(duì)和外引物對(duì)對(duì)待測(cè)snp位點(diǎn)所在序列進(jìn)行巢式pcr擴(kuò)增,從而提高第一引物對(duì)擴(kuò)增產(chǎn)物中目標(biāo)分子的純度。
為了進(jìn)一步降低利用上述引物組擴(kuò)增所得產(chǎn)物之間的結(jié)構(gòu)差異,基于上述任一實(shí)施例,本發(fā)明提出另一具體實(shí)施例,如圖2所示,所述第一引物對(duì)中的下游引物由第二通用區(qū)和第二互補(bǔ)區(qū)組成;所述第二互補(bǔ)區(qū)與所述第二通用區(qū)的3’末端連接;所述第二互補(bǔ)區(qū)為待測(cè)snp位點(diǎn)所在序列中的一段序列,處于待測(cè)snp位點(diǎn)的5’端;所述第二通用區(qū)與第三序列不同;所述第三序列為待測(cè)snp位點(diǎn)所在序列上與第二互補(bǔ)區(qū)的5’末端連接的一段序列。
需要說(shuō)明的是,所述第二通用區(qū)的序列既不是待測(cè)樣本的模板分子中待測(cè)snp位點(diǎn)附近的序列,也不是待測(cè)樣本的模板分子中待測(cè)snp位點(diǎn)附近的互補(bǔ)序列。所述第二通用區(qū)中無(wú)重復(fù)序列,自身不會(huì)形成發(fā)夾。基于本方案的第一引物對(duì)擴(kuò)增所得產(chǎn)物,在待測(cè)snp位點(diǎn)兩端各有一通用序列,針對(duì)不同的待測(cè)snp位點(diǎn),該第一通用區(qū)和第二通用區(qū)序列可均相同;從而降低了不同待測(cè)snp位點(diǎn)附近區(qū)域的序列復(fù)雜度。同時(shí)也使得針對(duì)各待測(cè)snp位點(diǎn)的擴(kuò)增效率更為一致。
基于上述任一實(shí)施例,為了使得基于第一引物對(duì)獲得的擴(kuò)增產(chǎn)物能夠更快的完成測(cè)序文庫(kù)的構(gòu)建,本發(fā)明提出一實(shí)施例,所述第一通用區(qū)中含有可斷裂位點(diǎn)。所述可斷裂位點(diǎn)能被切割劑特異性切割,使得基于第一引物對(duì)獲得的擴(kuò)增產(chǎn)物形成第一粘性末端。
本方案中,基于第一通用區(qū)中的可斷裂位點(diǎn),擴(kuò)增產(chǎn)物被切出第一粘性末端后,可與含有與第一粘性末端互補(bǔ)配對(duì)的第二粘性末端的接頭分子直接連接,提高連接效率。
優(yōu)選的,所述可斷裂位點(diǎn)為核糖核苷酸、rna序列或限制性?xún)?nèi)切酶酶切位點(diǎn)。相應(yīng)的,所述斷裂劑為rnaseh、rnaseh或限制性?xún)?nèi)切酶。
當(dāng)所述可斷裂位點(diǎn)為u時(shí),所述斷裂劑優(yōu)選為user酶。
優(yōu)選的,所述可斷裂位點(diǎn)與其所在鏈5’末端的距離為1至6個(gè)堿基。此時(shí),第一粘性末端與接頭的第二粘性末端的互補(bǔ)配對(duì)連接反應(yīng)效率較高,更優(yōu)選為4或5bp,此時(shí)連接反應(yīng)的效率最高。
為了更好的實(shí)現(xiàn)本發(fā)明的目的,本發(fā)明提出第二典型實(shí)施例,如圖3所示,一種錨定引物,所述錨定引物與第四序列完全互補(bǔ)配對(duì);所述第四序列為單鏈核酸分子,是上述任一種引物組中的第一引物對(duì)的擴(kuò)增產(chǎn)物中的一段序列;如圖3a所示,所述第四序列包括第一序列和第一歸一化區(qū),所述第一歸一化區(qū)與第一序列的3’末端連接,所述第四序列的5’末端距待測(cè)snp位點(diǎn)1至7bp;或如圖3b所示,所述第四序列包括第一互補(bǔ)區(qū)和第二歸一化區(qū),所述第二歸一化區(qū)與第一互補(bǔ)區(qū)的5’末端連接,所述第四序列的3’末端距待測(cè)snp位點(diǎn)1至7bp。
需要說(shuō)明的是,所述第一歸一化區(qū)為第一通用區(qū)的互補(bǔ)序列中與第一序列的3’末端連接一段序列;所述第二歸一化區(qū)為第一通用區(qū)中與第一互補(bǔ)區(qū)的5’端連接的一段序列。本方案中的錨定引物基于上述任一方案中引物組的第一引物對(duì)的擴(kuò)增產(chǎn)物構(gòu)建的測(cè)序文庫(kù)而設(shè)計(jì),針對(duì)不同的待測(cè)snp位點(diǎn),這些錨定引物含有一個(gè)共同第一歸一化序列或第二歸一化序列,它們能準(zhǔn)確錨定在目標(biāo)位置上,避免因?yàn)榇郎y(cè)snp位點(diǎn)附近序列的特殊性而導(dǎo)致的測(cè)序結(jié)果不準(zhǔn)確或測(cè)序失敗現(xiàn)象的出現(xiàn),又使得各錨定引物與目標(biāo)位置結(jié)合情況更為一致、歸一化,減小因?yàn)楦麇^定引物與目標(biāo)位置結(jié)合情況的差異,從而減小各待測(cè)snp位點(diǎn)檢測(cè)信號(hào)的差異,提高測(cè)序的準(zhǔn)確性。
基于上述實(shí)施例,本發(fā)明提出另一實(shí)施例,所述第四序列包括第一序列和第一歸一化區(qū),所述第一歸一化區(qū)與第一序列的3’末端連接,所述第一序列的5’末端距待測(cè)snp位點(diǎn)1至3bp;或所述第四序列包括第一互補(bǔ)區(qū)和第二歸一化區(qū),所述第二歸一化區(qū)與第一互補(bǔ)區(qū)的5’末端連接,所述第四序列的3’末端距待測(cè)snp位點(diǎn)1至3bp。
本方案中,錨定引物上用于延伸的一端與待測(cè)snp位點(diǎn)的距離為1至3bp,當(dāng)使用連接測(cè)序技術(shù)進(jìn)行測(cè)序時(shí),可保證僅通過(guò)一次錨定引物與特定位置含熒光標(biāo)記的探針的連接,即實(shí)現(xiàn)對(duì)待測(cè)snp位點(diǎn)的檢測(cè),提高高通量基因測(cè)序的效率,且1至3bp在t4連接酶的保真度范圍(1至7bp)中處于高保真的范圍,可有效提高待測(cè)snp位點(diǎn)的檢測(cè)準(zhǔn)確度;當(dāng)使用合成測(cè)序技術(shù)進(jìn)行測(cè)序時(shí),所述第四序列包括第一互補(bǔ)區(qū)和第二歸一化區(qū),所述第二歸一化區(qū)與第一互補(bǔ)區(qū)的5’末端連接,所述第四序列的3’末端距待測(cè)snp位點(diǎn)1bp,此時(shí)僅需要延伸1個(gè)bp,即進(jìn)行1個(gè)循環(huán)的反應(yīng),即可實(shí)現(xiàn)對(duì)待測(cè)snp位點(diǎn)的檢測(cè),檢測(cè)效率高。
在本發(fā)明的一個(gè)實(shí)施例中,所述第一互補(bǔ)區(qū)序列長(zhǎng)度在6至12bp之間。本方案進(jìn)一步保證了錨定引物與待測(cè)snp位點(diǎn)附近的目標(biāo)位置結(jié)合的特異性。更優(yōu)選的,所述第一互補(bǔ)區(qū)序列長(zhǎng)度在7至10bp之間。
在本發(fā)明的一個(gè)實(shí)施例中,所述第一歸一化區(qū)的長(zhǎng)度在8至14bp之間。本方案保證了針對(duì)不同待測(cè)snp位點(diǎn)設(shè)計(jì)的錨定引物與目標(biāo)位置的結(jié)合效率的一致性。
為了更好的實(shí)現(xiàn)本發(fā)明的目的,本發(fā)明提出第三典型實(shí)施例,一種試劑盒,包括上述的任一種引物組。
本方案中的試劑盒可為擴(kuò)增試劑盒、文庫(kù)構(gòu)建試劑盒或測(cè)序試劑盒。當(dāng)所述試劑盒為擴(kuò)增試劑盒時(shí),其還可包括pcr擴(kuò)增所需的其他試劑;當(dāng)所述試劑盒為文庫(kù)構(gòu)建試劑盒時(shí),其還可包括文庫(kù)構(gòu)建過(guò)程中所需的其他試劑,也可包括pcr擴(kuò)增所需的試劑;當(dāng)所述試劑盒為測(cè)序試劑盒時(shí),其可包括測(cè)序過(guò)程中所需的其他試劑,也可包括pcr擴(kuò)增所需的試劑,也可包括文庫(kù)構(gòu)建過(guò)程中所需的試劑。
在本發(fā)明的一個(gè)實(shí)施例中,所述試劑盒還包括上述的任一種錨定引物。
為了更好的實(shí)現(xiàn)本發(fā)明的目的,本發(fā)明提出第四典型實(shí)施例,一種試劑盒,包括上述的任一種錨定引物。
本方案中的試劑盒一般為測(cè)序試劑盒,其可包括測(cè)序過(guò)程中所需的其他試劑,也可包括pcr擴(kuò)增所需的試劑,也可包括文庫(kù)構(gòu)建過(guò)程中所需的試劑。
在本發(fā)明的一個(gè)實(shí)施例中,所述試劑盒還包括上述的任一種引物組。
為了更好的實(shí)現(xiàn)本發(fā)明的目的,本發(fā)明提出第五典型實(shí)施例,一種文庫(kù)構(gòu)建方法,包括以下步驟:
a、利用上述的任一種引物組,對(duì)待測(cè)樣本進(jìn)行pcr擴(kuò)增,得含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物;
b、將含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物與接頭連接,形成待測(cè)序文庫(kù)分子。
需要說(shuō)明的是,本方案中的待測(cè)序文庫(kù)分子是基于上述的任一種引物組對(duì)待測(cè)樣本進(jìn)行pcr擴(kuò)增后所得的擴(kuò)增產(chǎn)物獲得的,因此,在待測(cè)snp位點(diǎn)附近增加了一個(gè)含第一通用區(qū)的序列。所述第一通用區(qū)不與第二序列互補(bǔ),無(wú)重復(fù)序列,自身不會(huì)形成發(fā)夾。因此能夠有效簡(jiǎn)化待測(cè)snp位點(diǎn)附近的序列結(jié)構(gòu),降低錨定引物的設(shè)計(jì)難度,尤其適用于待測(cè)樣本中的模板分子上的待測(cè)snp位點(diǎn)附近序列結(jié)構(gòu)復(fù)雜的待測(cè)樣本,避免因?yàn)榇郎y(cè)snp位點(diǎn)附近序列的特殊性而導(dǎo)致的測(cè)序結(jié)果不準(zhǔn)確或測(cè)序失敗現(xiàn)象的出現(xiàn),適用于各類(lèi)型待測(cè)snp位點(diǎn)的檢測(cè)。針對(duì)不同的待測(cè)snp位點(diǎn),該第一通用區(qū)序列可相同。
另外,對(duì)于步驟b中,含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物與接頭的連接,以下將從多個(gè)方面進(jìn)行進(jìn)一步闡述。
在本發(fā)明的一個(gè)實(shí)施例中,含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物中僅有一端與接頭連接,進(jìn)而形成待測(cè)序文庫(kù)分子。該連接端可為含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物的任一端。
在本發(fā)明的另一個(gè)實(shí)施例中,含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物的兩端均與接頭連接,進(jìn)而形成待測(cè)序文庫(kù)分子。
需要說(shuō)明的是,兩端連接的接頭的序列可相同或不同。
優(yōu)選的,兩端連接的接頭的序列不同,這樣可基于這兩個(gè)不同的接頭對(duì)待測(cè)序文庫(kù)分子進(jìn)行擴(kuò)增驗(yàn)證,驗(yàn)證庫(kù)分子結(jié)構(gòu)是否正確,也可基于這兩個(gè)不同的接頭對(duì)待測(cè)序文庫(kù)分子進(jìn)行單分子擴(kuò)增,然后對(duì)單分子擴(kuò)增產(chǎn)物進(jìn)行第二代高通量基因測(cè)序,從而獲得待測(cè)snp位點(diǎn)的序列信息。
基于上述任一種實(shí)施例,本發(fā)明提出另一實(shí)施例,所述步驟b為:
將含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物直接與接頭連接,形成待測(cè)序文庫(kù)分子,并通過(guò)微球可尋址的固定在固相載體上。
本方案中,含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物直接與接頭連接,可有效減少實(shí)驗(yàn)步驟,提高實(shí)驗(yàn)效率。
需要說(shuō)明的是所述步驟b可有多種實(shí)施方案,以下將通過(guò)多個(gè)實(shí)施例來(lái)進(jìn)行說(shuō)明。
在本發(fā)明的一個(gè)實(shí)施例中,所述步驟b包括以下步驟:
b1、將含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物直接與固定在微球上的接頭連接,形成固定在微球上的待測(cè)序文庫(kù)分子;
b2、將步驟b1所得微球可尋址的固定在固相載體上。
在本發(fā)明的一個(gè)實(shí)施例中,所述步驟b包括以下步驟:
b1、將將含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物直接與接頭連接,然后將連接產(chǎn)物固定在微球上,得固定在微球上的待測(cè)序文庫(kù)分子;
b2、將步驟b1所得微球可尋址的固定在固相載體上。
需要說(shuō)明的是,在上述兩個(gè)實(shí)施例中,所述接頭上含有修飾標(biāo)記,用于使其固定在微球上。所述修飾標(biāo)記可為生物素、親和素、鏈霉親和素、抗原、抗體、受體、配體、多聚組氨酸、納米金、碘乙酰、巰基、氨基、醛基、羧基、異硫氰基、硅烷基或丙烯酰胺,它們均能特異性的與相對(duì)應(yīng)的基團(tuán)或分子結(jié)合。
所述可尋址的固定,是指能夠確定位置信息的固定。即,固定載體上每一具體位置上所固定的待測(cè)序文庫(kù)分子與其它具體位置上所固定的待測(cè)序文庫(kù)分子是能夠明確區(qū)分的。
上述實(shí)施例中,所述接頭可采用多種形式,包括但不限于平末端接頭、突出末端接頭、分叉接頭或含莖環(huán)結(jié)構(gòu)的接頭。
所述平末端接頭是指雙鏈之間完全互補(bǔ)配對(duì)的雙鏈核酸接頭。優(yōu)選的,所述平末端接頭的兩條鏈的5’末端均不含磷酸基團(tuán),其可避免連接過(guò)程中接頭自連現(xiàn)象的出現(xiàn),減少對(duì)后續(xù)測(cè)序?qū)嶒?yàn)的干擾,提高基因檢測(cè)的準(zhǔn)確率。
所述突出末端接頭,是指雙鏈核酸分子中的至少一端帶有突出核苷酸序列,而其余核苷酸則完全互補(bǔ)的雙鏈核酸接頭。突出末端接頭可為單突出末端,也可以是含有兩個(gè)突出末端的雙突出末端,這兩個(gè)突出末端可在一條核苷酸鏈上或在不同的核苷酸鏈上。所述突出末端接頭能夠避免連接過(guò)程中接頭自連現(xiàn)象的出現(xiàn),減少對(duì)后續(xù)測(cè)序?qū)嶒?yàn)的干擾,提高基因檢測(cè)的準(zhǔn)確率。在本實(shí)施例的具體實(shí)施方式中,所述接頭優(yōu)選為單突出末端接頭,且該突出末端為其所在鏈的3’末端,堿基為t;該接頭能夠與通過(guò)taq酶擴(kuò)增的含a尾的pcr擴(kuò)增產(chǎn)物直接連接,提高連接效率。
所述分叉型接頭包括互補(bǔ)區(qū)和分叉區(qū),互補(bǔ)區(qū)雙鏈的核苷酸互補(bǔ)配對(duì),配對(duì)的核苷酸對(duì)數(shù)不限。互補(bǔ)區(qū)末端可為平末端或突出末端。所述分叉型接頭能夠避免連接過(guò)程中接頭自連現(xiàn)象的出現(xiàn),減少對(duì)后續(xù)測(cè)序?qū)嶒?yàn)的干擾,提高snp分型檢測(cè)的準(zhǔn)確率。在本實(shí)施例的具體實(shí)施方式中,所述接頭優(yōu)選為互補(bǔ)區(qū)的3’末端為突出末端,且突出末端最后一個(gè)堿基為t的t末端分叉接頭;該接頭能夠與通過(guò)taq酶擴(kuò)增的含a尾的pcr擴(kuò)增產(chǎn)物直接連接,提高連接效率。
所述帶莖環(huán)結(jié)構(gòu)的接頭,有多種實(shí)施方案。在一實(shí)施例中,該接頭為單鏈核酸分子,該單鏈核酸分子依次包括第一互補(bǔ)配對(duì)區(qū)、莖環(huán)區(qū)和第二互補(bǔ)配對(duì)區(qū),第一互補(bǔ)配對(duì)區(qū)能夠與第二互補(bǔ)配對(duì)區(qū)完全互補(bǔ)配對(duì)。在另一實(shí)施例中,帶莖環(huán)結(jié)構(gòu)的接頭還可帶有突出末端,該突出末端可位于單鏈核酸分子的3’端。突出末端4的存在能夠防止接頭自連現(xiàn)象的發(fā)生,減少對(duì)后續(xù)測(cè)序?qū)嶒?yàn)的干擾,提高snp分型檢測(cè)的準(zhǔn)確率。該突出末端優(yōu)選為t;該接頭能夠與通過(guò)taq酶擴(kuò)增的含a尾的pcr擴(kuò)增產(chǎn)物直接連接,提高連接效率。
上述兩個(gè)實(shí)施例中,接頭被預(yù)先固定在微球上的實(shí)施例減少了連接產(chǎn)物與微球連接的步驟,實(shí)驗(yàn)效率更高。
因?yàn)楣潭ㄓ薪宇^的微球的密度可能會(huì)與步驟b反應(yīng)體系中的其他成分的密度不同,所以,在連接過(guò)程中,使整個(gè)反應(yīng)體系周期性震蕩,可有效提高固定在微球上的接頭與步驟a所得擴(kuò)增產(chǎn)物的連接效率,避免反應(yīng)體系中各成分分層而引起的連接效率低現(xiàn)象的出現(xiàn)。
另外,在本發(fā)明中,因?yàn)椴襟Ea所得的含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物直接與步驟b中的接頭連接,即不經(jīng)純化,直接進(jìn)行連接反應(yīng),這使得反應(yīng)體系較大,dna分子濃度較低,連接效率不高。在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,在所述步驟b的反應(yīng)體系中加入peg。
因?yàn)閜eg既能夠提高反應(yīng)體系中發(fā)生反應(yīng)的分子的有效密度,提高接頭與相應(yīng)的擴(kuò)增產(chǎn)物之間接觸的概率;又能提高反應(yīng)體系的密度,防止固定有接頭的微球沉降;本方案從兩個(gè)方面有效提高了固定在微球上的接頭與相應(yīng)的擴(kuò)增產(chǎn)物的連接效率。本方案中,peg的具體濃度可根據(jù)所述步驟b中微球的密度和原反應(yīng)體系的密度來(lái)計(jì)算,以使微球的密度與加入peg后的反應(yīng)體系的密度基本相同為宜。
基于上述實(shí)施例,本發(fā)明又提出一實(shí)施例,所述步驟b1中的連接反應(yīng)是在切割-連接反應(yīng)體系中進(jìn)行的,所述切割-連接反應(yīng)體系包括:連接酶、斷裂劑、固定在微球上的第一接頭和連接緩沖液;所述第一通用區(qū)中含有可斷裂位點(diǎn);所述可斷裂位點(diǎn)能被切割劑特異性切割,使得基于第一引物對(duì)獲得的擴(kuò)增產(chǎn)物形成第一粘性末端;所述第一接頭為核酸分子,含有與第一粘性末端完全互補(bǔ)配對(duì)的第二粘性末端。
本方案中,基于第一通用區(qū)中的可斷裂位點(diǎn),擴(kuò)增產(chǎn)物被斷裂劑切出第一粘性末端后,可與含有第二粘性末端的第一接頭直接連接,提高連接效率。
優(yōu)選的,所述可斷裂位點(diǎn)為核糖核苷酸、rna序列或限制性?xún)?nèi)切酶酶切位點(diǎn)。相應(yīng)的,所述斷裂劑為rnaseh、rnaseh或限制性?xún)?nèi)切酶。
當(dāng)所述可斷裂位點(diǎn)為u時(shí),所述斷裂劑優(yōu)選為user酶。
為了更好的實(shí)現(xiàn)本發(fā)明的目的,本發(fā)明提出第六典型實(shí)施例,一種基因測(cè)序方法,包括以下步驟:
a、利用上述任一種引物組,對(duì)待測(cè)樣本進(jìn)行pcr擴(kuò)增,得含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物;
b、將含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物與接頭連接,形成待測(cè)序文庫(kù)分子;
c、利用上述任一種錨定引物,對(duì)待測(cè)序文庫(kù)分子進(jìn)行測(cè)序,獲得待測(cè)snp位點(diǎn)的序列信息。
需要說(shuō)明的是,上述步驟a、b為文庫(kù)構(gòu)建步驟,其可采用上述的任一種文庫(kù)構(gòu)建方法進(jìn)行文庫(kù)構(gòu)建。以下主要通過(guò)對(duì)步驟c進(jìn)行進(jìn)一步闡述說(shuō)明。步驟c中的測(cè)序方法可為連接測(cè)序法也可為合成測(cè)序法。
本方案在測(cè)序過(guò)程中,錨定引物能準(zhǔn)確錨定在目標(biāo)位置上,避免因?yàn)榇郎y(cè)snp位點(diǎn)附近序列的特殊性而導(dǎo)致的測(cè)序結(jié)果不準(zhǔn)確或測(cè)序失敗現(xiàn)象的出現(xiàn),又使得各錨定引物與目標(biāo)位置結(jié)合情況更為一致、歸一化,減小因?yàn)楦麇^定引物與目標(biāo)位置結(jié)合情況的差異,從而減小各待測(cè)snp位點(diǎn)檢測(cè)信號(hào)的差異,提高測(cè)序的準(zhǔn)確性。
在本發(fā)明的一個(gè)實(shí)施例中,所述步驟c中的測(cè)序方法為連接測(cè)序法,所述步驟b、c之間還包括步驟d,采用權(quán)利要求7至11中的任一種錨定引物,利用無(wú)熒光標(biāo)記的寡核苷酸探針替換有熒光標(biāo)記的寡核苷酸探針,對(duì)待測(cè)序文庫(kù)分子進(jìn)行一次連接測(cè)序反應(yīng)。
需要說(shuō)明的是,所述無(wú)熒光標(biāo)記的寡核苷酸探針與連接測(cè)序技術(shù)中所使用的有熒光標(biāo)記的寡核苷酸探針相比,序列完全相同,差別僅在于有無(wú)熒光標(biāo)記;即,所述無(wú)熒光標(biāo)記的寡核苷酸探針序列為(n-n-n……-n)n,所述n為a、g、c或t,n為正整數(shù)。
每一次連接測(cè)序反應(yīng)均包括以下步驟:錨定引物錨定,沖洗(除去多余的未錨定引物),探針連接,沖洗(除去多余探針、連接酶等),采圖(獲得探針上熒光標(biāo)記所對(duì)應(yīng)位置的序列信息),變性洗脫連接產(chǎn)物(以便下一次連接測(cè)序反應(yīng)中錨定引物的錨定)。步驟c中的連接測(cè)序反應(yīng),因?yàn)槭褂玫氖菬o(wú)熒光標(biāo)記的寡核苷酸探針,因此可不進(jìn)行采圖步驟,以減少實(shí)驗(yàn)步驟,提高實(shí)驗(yàn)效率。當(dāng)然,如果進(jìn)行采圖步驟,可驗(yàn)證該次使用的熒光探針是否是無(wú)熒光標(biāo)記的,起到一個(gè)再次確認(rèn)的效果。
雖然,從理論上來(lái)說(shuō),步驟d中錨定引物與無(wú)熒光標(biāo)記的寡核苷酸案子會(huì)被洗脫去除,無(wú)法起到封閉的作用,但是,本申請(qǐng)發(fā)明人在具體實(shí)驗(yàn)中對(duì)比發(fā)現(xiàn),在連接測(cè)序前,增加一個(gè)使用無(wú)熒光標(biāo)記的寡核苷酸探針替換有熒光標(biāo)記的探針進(jìn)行一次連接測(cè)序反應(yīng)的步驟,有效的減少在后續(xù)的連接測(cè)序中出現(xiàn)的錯(cuò)誤信號(hào),從而減少由測(cè)序初始結(jié)果到最終的序列信息的分析過(guò)程中的干擾信號(hào),提高snp位點(diǎn)檢測(cè)的準(zhǔn)確性。具體原因可能是非錨定引物的目標(biāo)結(jié)合位點(diǎn)和/或非探針的目標(biāo)結(jié)合位點(diǎn)經(jīng)過(guò)步驟d后被封閉,使得在后續(xù)的連接測(cè)序?qū)嶒?yàn)中,錨定引物和/或探針能夠更多更準(zhǔn)確的結(jié)合在目標(biāo)結(jié)合位點(diǎn)上,從而減少了錯(cuò)誤信號(hào)的產(chǎn)生,從而提高基因檢測(cè)過(guò)程中正確信號(hào)的比例,提高了對(duì)snp位點(diǎn)進(jìn)行檢測(cè)的準(zhǔn)確性。
優(yōu)選的,所述n在6-10之間;更優(yōu)選在7-9之間。
更優(yōu)選的,所述無(wú)熒光標(biāo)記的寡核苷酸探針與步驟d中的有熒光標(biāo)記的寡核苷酸探針序列完全相同,差別僅在于有無(wú)熒光標(biāo)記。本方案可有效降低無(wú)熒光標(biāo)記的寡核苷酸探針的設(shè)計(jì)難度。
在本發(fā)明的一個(gè)實(shí)施例中,所述步驟d包括以下步驟:
d1、將所述錨定引物錨定在待測(cè)序文庫(kù)分子上;
d2、加入無(wú)熒光標(biāo)記的寡核苷酸探針、連接酶以及相應(yīng)的緩沖液,進(jìn)行連接反應(yīng);
d3、變性去除連接產(chǎn)物。
對(duì)于步驟d3中變性去除連接產(chǎn)物需要說(shuō)明的是,步驟d3所述連接產(chǎn)物為錨定引物與無(wú)熒光標(biāo)記的寡核苷酸探針的連接產(chǎn)物,為單鏈核酸分子,可與待測(cè)序文庫(kù)分子互補(bǔ)配對(duì)。所述變性既可以通過(guò)物理的方法實(shí)現(xiàn),例如提高雙鏈核酸分子(待測(cè)序文庫(kù)分子與連接產(chǎn)物)所處的溫度,也可以通過(guò)化學(xué)的方法實(shí)現(xiàn),例如改變雙鏈核酸分子(待測(cè)序文庫(kù)分子與連接產(chǎn)物)所處的ph值。其中,采用化學(xué)方法,只需加入酸性或堿性的試劑即可,無(wú)需額外的加熱部件,能夠更簡(jiǎn)單有效的實(shí)現(xiàn)自動(dòng)化。
優(yōu)選的,所述步驟d3為:用0.05m-0.15mnaoh沖洗。
針對(duì)上述各技術(shù)方案,為進(jìn)一步說(shuō)明本發(fā)明所記載技術(shù)方案的技術(shù)效果及優(yōu)越性,本發(fā)明給出下述具體實(shí)施例。
在第一具體實(shí)施例中,以10個(gè)正常人的血液基因組dna為模板,同時(shí)檢測(cè)cyp2c9基因*2(rs1799853)位點(diǎn)、aldh2基因rs671位點(diǎn)、adrb1基因rs1801253位點(diǎn)。
針對(duì)這些位點(diǎn),分別設(shè)計(jì)了一對(duì)內(nèi)引物和一對(duì)外引物。具體如下所述:
rs1799853內(nèi)引物對(duì)為:seqidno:1和seqidno:2;rs1799853外引物對(duì)為:seqidno:3和seqidno:4;rs671內(nèi)引物對(duì)為:seqidno:5和seqidno:6;rs671外引物對(duì)為:seqidno:7和seqidno:8;rs1801253內(nèi)引物對(duì)為:seqidno:9和seqidno:10;rs1801253外引物對(duì)為:seqidno:11和seqidno:12。
一、含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物的獲得。
1、第一次pcr擴(kuò)增
以血液基因組dna為模板,利用上述的外引物對(duì),分別對(duì)各snp位點(diǎn)所在序列進(jìn)行擴(kuò)增,反應(yīng)體系為:f引物(10μm),0.4μl;r引物(10μm),0.4μl;dntp(各2.5mm),2μl;血液基因組dna,50ng;extaq(5u/μl),0.1μl;10×extaqbuffer,2μl;ddh2o加至20μl。
pcr反應(yīng)條件如下:94℃5min;94℃20s,57℃20s,72℃25s;重復(fù)30個(gè)循環(huán);72℃3min。
所得產(chǎn)物即為第一次pcr擴(kuò)增產(chǎn)物。
2、第二次pcr擴(kuò)增
以第一次pcr擴(kuò)增產(chǎn)物為模板,利用上述的內(nèi)引物對(duì),分別對(duì)各snp位點(diǎn)所在序列進(jìn)行擴(kuò)增,反應(yīng)體系為:f引物(10μm),0.4μl;r引物(10μm),0.4μl;dntp(各2.5mm),2μl;第一次pcr擴(kuò)增產(chǎn)物,0.2μl;extaq(5u/μl),0.1μl;10×extaqbuffer,2μl;ddh2o加至20μl。
pcr反應(yīng)條件如下:95℃5min;94℃20s,40℃20s,57℃25s;重復(fù)5個(gè)循環(huán);94℃20s,57℃20s,72℃25s;重復(fù)30個(gè)循環(huán);72℃3min。
所得產(chǎn)物即為第二次擴(kuò)增產(chǎn)物。
第二次擴(kuò)增完成后,經(jīng)瓊脂糖凝膠電泳檢測(cè),所有樣本的第二次擴(kuò)增產(chǎn)物中均含有目標(biāo)分子,且凝膠電泳圖顯示無(wú)雜帶,條帶單一;說(shuō)明第二次pcr擴(kuò)增成功獲得了所需的pcr擴(kuò)增產(chǎn)物。
二、待測(cè)序文庫(kù)分子的構(gòu)建。
1、將第一接頭固定在微球上。
為了在同時(shí)檢測(cè)過(guò)程中能夠區(qū)分不同的樣本來(lái)源,本具體實(shí)施例在第一接頭上設(shè)計(jì)了標(biāo)簽序列,第一接頭的基本結(jié)構(gòu)如圖4所示(seqidno:13、seqidno:14),該接頭中的nnnn為標(biāo)簽序列,標(biāo)簽序列與樣本來(lái)源和snp位點(diǎn)的對(duì)應(yīng)關(guān)系如圖5所示。
將上述各第一接頭分別與帶有鏈霉親和素修飾的myone磁珠(invitrogen)結(jié)合,使得上述各第一接頭被分別固定在磁珠表面,反應(yīng)體系及反應(yīng)過(guò)程為:將200ng第一接頭與4μl(約4×107個(gè)磁珠)myone磁珠螺旋振蕩混勻,反應(yīng)30min,以適量te緩沖液(10mmtris-hcl,ph8.0;1mmedta)清洗兩次,離心分離,將得到的磁珠以4μl結(jié)合緩沖液(10mmtris-hcl,ph7.5;1mmedta;1mnacl;0.01%tritonx-100)重懸保存,得固定有第一接頭的磁珠。
2、第二次pcr擴(kuò)增產(chǎn)物與固定在磁珠上的第一接頭的連接。
按按表2中的對(duì)應(yīng)關(guān)系分別配置下述反應(yīng)體系:步驟一所得擴(kuò)增產(chǎn)物20μl;user酶(1u/μl,neb,cat#m5505s),10μl;緩沖液,8μl;t4dna連接酶,2μl;固定有第一接頭的磁珠,0.4μl;加ddh2o至40μl。
其中,所述緩沖液為含400mmtris、100mmmgcl2、100mmdtt、5mmatp、25%peg6000,ph值7.8的溶液。
25℃反應(yīng)20分鐘,得連接產(chǎn)物,即待測(cè)序文庫(kù)分子。
反應(yīng)結(jié)束后,將30管連接產(chǎn)物合并成1管,2500g離心3min,磁鐵吸附磁珠,去上清,用50μlte洗滌二次,并最終懸浮于50μlte中,從而將待測(cè)序文庫(kù)分子固定在磁珠上。
3、固定在磁珠上的待測(cè)序文庫(kù)分子的可尋址固定。
將步驟2所得產(chǎn)物點(diǎn)樣至異硫氰基修飾的載樣片(玻片),于37℃固定1h,即完成固定在磁珠上的待測(cè)序文庫(kù)分子的可尋址固定。
三、測(cè)序。
對(duì)步驟二所得的固定在固相載體上的待測(cè)序文庫(kù)分子進(jìn)行測(cè)序。
在本具體實(shí)施例中采用深圳華因康基因科技有限公司的高通量基因測(cè)序儀pstariia測(cè)序儀,并采用連接測(cè)序法進(jìn)行測(cè)序。測(cè)序過(guò)程中,
針對(duì)rs1799853位點(diǎn),所使用的錨定引物為seqidno:15;針對(duì)rs671位點(diǎn),所使用的錨定引物為seqidno:16;針對(duì)rs1801253位點(diǎn),所使用的錨定引物為seqidno:17。
另外,為了區(qū)分不同的樣本來(lái)源,還需對(duì)第一接頭上的標(biāo)簽序列進(jìn)行檢測(cè),用于檢測(cè)標(biāo)簽序列的錨定引物為seqidno:18。
需要說(shuō)明的是,seqidno:15-18的的5’端均被磷酸化修飾。
整體的測(cè)序順序如圖6所示。其中,待測(cè)snp位點(diǎn)anchor混合物為seqidno:15-17這3種錨定引物按相同摩爾數(shù)混合所得的混合物。其中,base1用于封閉錨定引物或探針與待測(cè)序文庫(kù)分子上的非特異性結(jié)合位點(diǎn),base2用于檢測(cè)待測(cè)snp位點(diǎn),base3-6用于檢測(cè)標(biāo)簽序列。
另外,本實(shí)施例做了第一對(duì)比實(shí)驗(yàn),同樣步驟二所得產(chǎn)物,以圖7中的測(cè)序順序進(jìn)行測(cè)序。即,未進(jìn)行圖6中的base1。
圖8示出了上述具體實(shí)施例中樣本2的待測(cè)snp位點(diǎn)——rs1799853、rs671、rs1801253在實(shí)驗(yàn)組和第一對(duì)比組中的初步實(shí)驗(yàn)結(jié)果。其中,r=a/g,y=c/t,m=a/c,k=g/t,s=c/g,w=a/t,h=a/c/t,b=c/g/t,v=a/c/g,d=a/g/t,n=a/c/g/t;n表示信號(hào)太弱,無(wú)法判斷是a、c、g和t中的哪一個(gè)。
由實(shí)驗(yàn)結(jié)果可知,相同樣本在實(shí)驗(yàn)組和第一對(duì)比組中占比最高的snp位點(diǎn)序列類(lèi)型均相同,但是它們的占比有明顯區(qū)別;實(shí)驗(yàn)組中占比最高的snp位點(diǎn)序列類(lèi)型檢出數(shù)均在95%以上,而第一對(duì)比組中占比最高的snp位點(diǎn)序列類(lèi)型檢出數(shù)基本在85%左右。
另外,本發(fā)明人還將第二次擴(kuò)增產(chǎn)物通過(guò)sanger測(cè)序進(jìn)行驗(yàn)證,作為第二對(duì)比實(shí)驗(yàn),結(jié)果顯示,上述實(shí)驗(yàn)組和第一對(duì)比組中占比最高的snp位點(diǎn)序列類(lèi)型均與sanger測(cè)序結(jié)果完全一致。
為了證明本發(fā)明的引物組、錨定引物的技術(shù)效果,本實(shí)驗(yàn)發(fā)明人還做了第三對(duì)比實(shí)驗(yàn),同樣以上述具體實(shí)施例中的正常人的血液基因組dna為模板,同時(shí)檢測(cè)cyp2c9基因*2(rs1799853)位點(diǎn)、aldh2基因rs671位點(diǎn)、adrb1基因rs1801253位點(diǎn)。
針對(duì)這些位點(diǎn),分別設(shè)計(jì)了一對(duì)內(nèi)引物和一對(duì)外引物。具體如下所述:
rs1799853內(nèi)引物對(duì)為:seqidno:19和seqidno:20;rs1799853外引物對(duì)為:seqidno:3和seqidno:4;rs671內(nèi)引物對(duì)為:seqidno:21和seqidno:22;rs671外引物對(duì)為:seqidno:7和seqidno:8;rs1801253內(nèi)引物對(duì)為:seqidno:23和seqidno:24;rs1801253外引物對(duì)為:seqidno:11和seqidno:12。
一、含待測(cè)snp位點(diǎn)的擴(kuò)增產(chǎn)物的獲得。
1、第一次pcr擴(kuò)增。
以血液基因組dna為模板,利用上述的外引物對(duì),分別對(duì)各snp位點(diǎn)所在序列進(jìn)行擴(kuò)增,反應(yīng)體系為:f引物(10μm),0.4μl;r引物(10μm),0.4μl;dntp(各2.5mm),2μl;血液基因組dna,50ng;extaq(5u/μl),0.1μl;10×extaqbuffer,2μl;ddh2o加至20μl。
pcr反應(yīng)條件如下:94℃5min;94℃20s,57℃20s,72℃25s;重復(fù)30個(gè)循環(huán);72℃3min。
所得產(chǎn)物即為第一次pcr擴(kuò)增產(chǎn)物。
2、第二次pcr擴(kuò)增。
以第一次pcr擴(kuò)增產(chǎn)物為模板,利用上述的內(nèi)引物對(duì),分別對(duì)各snp位點(diǎn)所在序列進(jìn)行擴(kuò)增,反應(yīng)體系為:f引物(10μm),0.4μl;r引物(10μm),0.4μl;dntp(各2.5mm),2μl;第一次pcr擴(kuò)增產(chǎn)物,0.2μl;extaq(5u/μl),0.1μl;10×extaqbuffer,2μl;ddh2o加至20μl。
pcr反應(yīng)條件如下:95℃3min;94℃20s,57℃20s,72℃30s;重復(fù)30個(gè)循環(huán);72℃3min。
所得產(chǎn)物即為第二次擴(kuò)增產(chǎn)物。
第二次擴(kuò)增完成后,經(jīng)瓊脂糖凝膠電泳檢測(cè),所有樣本的第二次擴(kuò)增產(chǎn)物中均含有目標(biāo)分子,且凝膠電泳圖顯示無(wú)雜帶,條帶單一;說(shuō)明第二次pcr擴(kuò)增成功獲得了所需的pcr擴(kuò)增產(chǎn)物。
二、待測(cè)序文庫(kù)分子的構(gòu)建。
采用上一具體實(shí)施例相同的方法構(gòu)建測(cè)序文庫(kù)并將待測(cè)序文庫(kù)分子可尋址固定。
三、測(cè)序。
對(duì)步驟二所得的固定在固相載體上的待測(cè)序文庫(kù)分子進(jìn)行測(cè)序。
在第三對(duì)比實(shí)驗(yàn)中同樣采用深圳華因康基因科技有限公司的高通量基因測(cè)序儀pstariia測(cè)序儀,并采用連接測(cè)序法進(jìn)行測(cè)序。測(cè)序過(guò)程中,針對(duì)rs1799853位點(diǎn),所使用的錨定引物為seqidno:25;針對(duì)rs671位點(diǎn),所使用的錨定引物為seqidno:26;針對(duì)rs1801253位點(diǎn),所使用的錨定引物為seqidno:27。
另外,為了區(qū)分不同的樣本來(lái)源,還需對(duì)第一接頭上的標(biāo)簽序列進(jìn)行檢測(cè),用于檢測(cè)標(biāo)簽序列的錨定引物為seqidno:18。
需要說(shuō)明的是,seqidno:18、25-27的5’端均被磷酸化修飾。
然后參考上一具體實(shí)施例中的方法,更換錨定引物后,按照?qǐng)D6的順序進(jìn)行測(cè)序;另外,同樣以本具體實(shí)施例步驟二所得產(chǎn)物,更換錨定引物后,按照?qǐng)D7的順序進(jìn)行測(cè)序,作為對(duì)照。
其中,rs671和rs1801253位點(diǎn)的測(cè)序采圖結(jié)果如圖9(實(shí)驗(yàn)組和對(duì)照組)所示,由圖9可知,這兩個(gè)位點(diǎn)在兩次測(cè)序過(guò)程中均無(wú)熒光發(fā)生,測(cè)序失??;這與上一具體實(shí)施例中rs671和rs1801253的測(cè)序采圖結(jié)果(圖10實(shí)驗(yàn)組和對(duì)照組)存在明顯區(qū)別。而rs1799853位點(diǎn)的實(shí)驗(yàn)組測(cè)序采圖結(jié)果如圖11所示,與上一具體實(shí)施例中的實(shí)驗(yàn)組rs1799853位點(diǎn)的測(cè)序采圖結(jié)果(圖12)相比,同樣存在明顯區(qū)別,熒光信號(hào)明顯較弱。rs1799853位點(diǎn)的對(duì)照組測(cè)序采圖結(jié)果與上一具體實(shí)施例中對(duì)照組的測(cè)序采圖結(jié)果,與實(shí)驗(yàn)組類(lèi)似,熒光信號(hào)明顯較弱。
經(jīng)本發(fā)明人分析,rs671和rs1801253位點(diǎn)的在本具體實(shí)施例中,實(shí)驗(yàn)組和對(duì)照組均測(cè)序失敗的原因可能是:rs671和rs1801253這兩個(gè)位點(diǎn)附近的序列中存在復(fù)雜結(jié)構(gòu),導(dǎo)致錨定引物無(wú)法錨定,進(jìn)而無(wú)法實(shí)現(xiàn)錨定引物與探針的連接,所以采圖時(shí)無(wú)信號(hào)。
而rs1799853位點(diǎn)在本具體實(shí)施例中實(shí)驗(yàn)組和對(duì)照組的測(cè)序采圖結(jié)果分別與上一具體實(shí)施例中的實(shí)驗(yàn)組和對(duì)照組的測(cè)序采圖結(jié)果相比,熒光信號(hào)都明顯較弱。原因可能是本具體實(shí)施例中,錨定引物與待測(cè)序文庫(kù)分子的結(jié)合效果,較上一具體實(shí)施例差。
在本發(fā)明的第二具體實(shí)施例中,直接用上述實(shí)施例中的rs1799853內(nèi)引物對(duì)為:seqidno:1和seqidno:2;rs671內(nèi)引物對(duì)為:seqidno:5和seqidno:6;rs1801253內(nèi)引物對(duì)為:seqidno:9和seqidno:10。對(duì)上述樣本1-10進(jìn)行pcr擴(kuò)增,然后進(jìn)行后續(xù)的步驟二、三,所得實(shí)驗(yàn)結(jié)果和第一具體實(shí)施例結(jié)果基本一致,實(shí)驗(yàn)組中占比最高的snp位點(diǎn)序列類(lèi)型檢出數(shù)均在93%以上,而對(duì)照組中占比最高的snp位點(diǎn)序列類(lèi)型檢出數(shù)基本在80%左右。整體來(lái)說(shuō),實(shí)驗(yàn)組和對(duì)照組的檢出數(shù)和檢出總數(shù)均較上一實(shí)施例低,且無(wú)論是在實(shí)驗(yàn)組還是在對(duì)照組中,占比最高的snp位點(diǎn)序列類(lèi)型檢出數(shù)所占比例有所降低。
需要說(shuō)明的是,上述具體實(shí)施例中,所述使用的引物中,可斷裂位點(diǎn)均為u,且均設(shè)計(jì)在上游引物上,斷裂序列(與第一粘性末端對(duì)應(yīng))為cggu。當(dāng)然,也可將可斷裂位點(diǎn)設(shè)計(jì)在下游引物上。所述斷裂序列可根據(jù)需要進(jìn)行設(shè)計(jì),只要能滿(mǎn)足后續(xù)的連接實(shí)驗(yàn)的要求即可,例如:gccu、aaau、cgcu、gcccu、cggcu、ttttu等。隨著所述斷裂序列的改變,所述第一接頭的相關(guān)序列需進(jìn)行相關(guān)調(diào)整。
另外,上述具體實(shí)施例中,測(cè)序文庫(kù)分子構(gòu)建完成后,均未采用單分子擴(kuò)增技術(shù)進(jìn)行擴(kuò)增,而是直接進(jìn)入到后續(xù)的測(cè)序步驟,簡(jiǎn)化了實(shí)驗(yàn)步驟。當(dāng)然,本申請(qǐng)發(fā)明人經(jīng)過(guò)實(shí)驗(yàn)發(fā)現(xiàn),通過(guò)單分子擴(kuò)增技術(shù)對(duì)待測(cè)序文庫(kù)分子進(jìn)行擴(kuò)增后再進(jìn)行測(cè)序,所得實(shí)驗(yàn)結(jié)果與上述實(shí)驗(yàn)結(jié)果基本相同。相對(duì)來(lái)說(shuō),測(cè)序采圖所得信號(hào)會(huì)更高一點(diǎn)。
以上,本發(fā)明的方法能夠高效的同時(shí)對(duì)多個(gè)樣品的多個(gè)snp位點(diǎn)同時(shí)進(jìn)行檢測(cè),并得到準(zhǔn)確可信的結(jié)果,并且能夠有效的降低連接測(cè)序所得結(jié)果中的錯(cuò)誤信號(hào),提高snp位點(diǎn)檢測(cè)的準(zhǔn)確性。
應(yīng)當(dāng)說(shuō)明的是,以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
sequencelisting
<110>盛司潼
<120>引物組、錨定引物、試劑盒、文庫(kù)構(gòu)建及基因測(cè)序方法
<130>
<160>27
<170>patentinversion3.3
<210>1
<211>26
<212>dna
<213>人工序列
<400>1
cgguctcagcctcccaagttgaggac26
<210>2
<211>21
<212>dna
<213>人工序列
<400>2
gtgagaaacagcacacaagtt21
<210>3
<211>20
<212>dna
<213>人工序列
<400>3
agcttcctctttcttgcctg20
<210>4
<211>21
<212>dna
<213>人工序列
<400>4
tgagctaacaaccaggactca21
<210>5
<211>26
<212>dna
<213>人工序列
<400>5
cgguctcagcctcccaagcatacact26
<210>6
<211>21
<212>dna
<213>人工序列
<400>6
gtgagaaacagcattttcact21
<210>7
<211>20
<212>dna
<213>人工序列
<400>7
aacccataacccccaagagt20
<210>8
<211>21
<212>dna
<213>人工序列
<400>8
cagcaggtcctgaacttccag21
<210>9
<211>26
<212>dna
<213>人工序列
<400>9
cgguctcagcctcccaagccttccag26
<210>10
<211>21
<212>dna
<213>人工序列
<400>10
gtgagaaacagcaagagcagt21
<210>11
<211>22
<212>dna
<213>人工序列
<400>11
tctgctggctgcccttcttcct22
<210>12
<211>22
<212>dna
<213>人工序列
<400>12
acgacatcgtcgtcgtcgtcgt22
<210>13
<211>50
<212>dna
<213>人工序列
<220>
<221>misc_feature
<222>(23)..(26)
<223>nisa,c,g,ort
<400>13
cctccctgcagtctctatgggcnnnnctgctagtcgctgaagtagtcggt50
<210>14
<211>42
<212>dna
<213>人工序列
<400>14
ctacttcagcgactagcagacgtgcccatagagactgcaggg42
<210>15
<211>17
<212>dna
<213>人工序列
<400>15
gtcctcaacttgggagg17
<210>16
<211>17
<212>dna
<213>人工序列
<400>16
agtgtatgcttgggagg17
<210>17
<211>17
<212>dna
<213>人工序列
<400>17
ctggaaggcttgggagg17
<210>18
<211>17
<212>dna
<213>人工序列
<400>18
gcccatagagactgcag17
<210>19
<211>22
<212>dna
<213>人工序列
<400>19
cgguctcatgacgctgcggaat22
<210>20
<211>19
<212>dna
<213>人工序列
<400>20
gatatggagtagggtcacc19
<210>21
<211>26
<212>dna
<213>人工序列
<400>21
cgguactgctatgatgtgtttggagc26
<210>22
<211>20
<212>dna
<213>人工序列
<400>22
agcaggtcccacactcacag20
<210>23
<211>22
<212>dna
<213>人工序列
<400>23
cggugtgcccgaccgcctcttc22
<210>24
<211>18
<212>dna
<213>人工序列
<400>24
gtctccgtgggtcgcgtg18
<210>25
<211>17
<212>dna
<213>人工序列
<400>25
gtcctcaatgctcctct17
<210>26
<211>17
<212>dna
<213>人工序列
<400>26
agtgtatgcctgcagcc17
<210>27
<211>17
<212>dna
<213>人工序列
<400>27
ctggaaggccttgcgga17