本發(fā)明屬于生物技術(shù)領(lǐng)域,涉及一種DNA序列測(cè)定的方法,具體涉及一種核苷酸結(jié)合不同電量的氨基酸進(jìn)行核酸序列測(cè)定的方法。
背景技術(shù):
DNA(脫氧核糖核酸)是組成生物體的最基本物質(zhì)之一,其序列的變化造就了如今這個(gè)紛繁美麗的物質(zhì)世界。幾乎可以說地球所有的生命現(xiàn)象都來(lái)源于A、T、C、G這幾個(gè)堿基的不同排列順序,并且這種序列并非無(wú)意義的隨機(jī)組合,而是蘊(yùn)含了相當(dāng)豐富的遺傳信息以及生命內(nèi)涵。通過測(cè)序技術(shù)就可以有效地獲取基因組的核酸序列,極大地方便人們從基因水平上認(rèn)識(shí)生命體的差異性。因此,DNA測(cè)序?qū)ι茖W(xué)研究、疾病診斷、個(gè)性化用藥等均具有十分重要的意義。
從人類基因組計(jì)劃完成以來(lái),基因組測(cè)序技術(shù)得到了迅猛的發(fā)展。20世紀(jì)70年代中期,由Sanger發(fā)明的雙脫氧鏈末端終止法為代表的第一代測(cè)序技術(shù)幫助人們完成了從噬菌體基因組到人類基因組草圖等大量測(cè)序工作,但是其存在著成本高,速度慢,通量低等不足,已經(jīng)不能滿足研究應(yīng)用的需要。1995年以后出現(xiàn)了以Roche的454、ABI的Solid和Illumina的Solexa為代表的二代測(cè)序技術(shù),其主要是根據(jù)模板序列合成或雜交形成互補(bǔ)鏈,在互補(bǔ)鏈延伸過程中引入不同顏色熒光標(biāo)記的dNTP,通過捕獲不同熒光信號(hào)來(lái)獲得序列信息,而2010年Ion Torrent推出的PGM,則利用半導(dǎo)體芯片檢測(cè)堿基聚合反應(yīng)產(chǎn)生的質(zhì)子,進(jìn)行測(cè)序,特點(diǎn)是經(jīng)濟(jì)快速,但是其準(zhǔn)確性不高。相對(duì)于一代測(cè)序,二代測(cè)序有了革命性的改變,其通量、成本和速率都得到了卓越的提升,但是其技術(shù)瓶頸是難以克服的,尤其是模板擴(kuò)增和序列讀長(zhǎng)。以Pacific Bioscience的SMRT技術(shù)為代表的第三代測(cè)序也是基于邊合成邊測(cè)序的原理,在聚合酶活性位點(diǎn)上不同顏色熒光標(biāo)記磷酸基團(tuán)的dNTP與模板逐個(gè)結(jié)合,產(chǎn)生熒光信號(hào),通過獲取熒光信號(hào)讀取核酸序列信息。與二代測(cè)序相比,第三代測(cè)序?qū)崿F(xiàn)了單分子測(cè)序,具有不需要擴(kuò)增,讀長(zhǎng)長(zhǎng)等優(yōu)勢(shì),但是其準(zhǔn)確率還有待提高。
目前上市測(cè)序系統(tǒng),包括第一代、第二代、第三代,絕大多數(shù)都是采用四種不同顏色的熒光標(biāo)記dNTP,檢測(cè)時(shí)通過dNTP與模板聚合釋放的熒光信號(hào)來(lái)識(shí)別不同堿基,也就是信號(hào)的獲取是通過光學(xué)檢測(cè)來(lái)實(shí)現(xiàn)的。而單分子熒光檢測(cè)對(duì)光學(xué)器件的靈敏度和視場(chǎng)背景干擾的消除等技術(shù)要求非??量?,這也是二代測(cè)序此前無(wú)法實(shí)現(xiàn)單分子測(cè)序的一個(gè)重要原因。雖然Pacific Bioscience的RS系統(tǒng)利用零模波導(dǎo)原理消除背景,但是其儀器價(jià)格非常昂貴,接近100萬(wàn)美元。
此外還有一個(gè)非常關(guān)鍵的因素就是價(jià)格,人類基因組計(jì)劃開展伊始階段,計(jì)劃30億美元完成人的基因組測(cè)序工作,相當(dāng)于一個(gè)堿基1美元。隨著測(cè)序技術(shù)的發(fā)展,如今主流的測(cè)序設(shè)備完成一個(gè)人的需要1萬(wàn)美元,可以看到測(cè)序成本已經(jīng)比十幾年前降了6個(gè)數(shù)量級(jí),但是其大規(guī)模應(yīng)用還是受限,所以必須要在 現(xiàn)有的技術(shù)體系上實(shí)現(xiàn)突破,直至出現(xiàn)完美的測(cè)序技術(shù)!
技術(shù)實(shí)現(xiàn)要素:
基因測(cè)序能夠揭示基因組DNA的脫氧核苷酸排列順序,獲取生物遺傳信息??焖俸蜏?zhǔn)確的獲取生物的遺傳信息對(duì)生物和醫(yī)學(xué)具有十分重要的意義。本發(fā)明的一個(gè)目的在于提供一種基于氨基酸結(jié)合dNTP進(jìn)行DNA測(cè)序的方法,本發(fā)明利用不同帶電量的氨基酸區(qū)分不同堿基,通過檢測(cè)氨基酸基團(tuán)的電荷實(shí)現(xiàn)核酸序列經(jīng)濟(jì)、快速地測(cè)定,打破熒光檢測(cè)的局限,有助于降低測(cè)序成本。
DNA由A、T、C、G四種脫氧核苷酸組成,為了區(qū)分這四種脫氧核苷酸,需要對(duì)其進(jìn)行標(biāo)記,使其帶有不同的電荷或不同的長(zhǎng)度標(biāo)志被檢測(cè)芯片識(shí)別。不同的氨基酸帶有不同的電荷量,所以本發(fā)明設(shè)計(jì)四種帶不同電荷量的氨基酸四磷酸脫氧核苷酸,其中氨基酸是可離去基團(tuán),當(dāng)DNA進(jìn)行合成時(shí),每合上一個(gè)脫氧核苷酸,它所帶的氨基酸基團(tuán)就會(huì)離去并進(jìn)入半導(dǎo)體芯片上的檢測(cè)井,不同帶電量的氨基酸基團(tuán)將引起井內(nèi)流過場(chǎng)效應(yīng)晶體管的電流的不同變化,從而被芯片捕獲并識(shí)別,從而測(cè)定A、T、C、G排列順序。
為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明技術(shù)方案為:一種基于氨基酸結(jié)合脫氧核苷酸的DNA測(cè)序方法,包括以下步驟:
(1)利用dNTP構(gòu)建氨基酸-磷酸脫氧核苷酸(核苷酸類似物),首先制備磷酸化氨基酸,然后將磷酸化的氨基酸和脫氧核苷酸的磷酸基團(tuán)結(jié)合,至少包括2個(gè)磷酸基團(tuán),如圖1所示。其中Base代表核苷堿基,包括A、T、G、C或U,AA代表不同帶電量的氨基酸基團(tuán),n表示磷酸基團(tuán)個(gè)數(shù)。不同帶電量的氨基酸取代核苷末端磷酸基團(tuán)的-OH可以得到至少四種氨基酸修飾的核苷酸類似物;
所述不同帶電量核苷酸類似物的磷酸基團(tuán)個(gè)數(shù)n可以是0,1,2,3,4...;
所述氨基酸可以是賴氨酸,精氨酸,組氨酸,酪氨酸,半胱氨酸,谷氨酸,天冬氨酸等氨基酸基團(tuán);
所述氨基酸核苷酸類似物至少包括一個(gè)氨基酸基團(tuán),也可以是多個(gè)氨基酸形成的縮聚物;
所述磷酸基團(tuán)和氨基酸基團(tuán)可以直接或間接結(jié)合;
作為優(yōu)選A、T、C、G脫氧核苷酸分別和賴氨酸、精氨酸、谷氨酸、天冬氨酸結(jié)合形成脫氧核苷酸類似物;
作為優(yōu)選磷酸基團(tuán)個(gè)數(shù)≥2。
(2)將待測(cè)結(jié)合有引物的DNA模板及緩沖溶液移至檢測(cè)芯片中,待測(cè)DNA模板進(jìn)入芯片的井中,每個(gè)井容納零條或一條DNA鏈,井特定位置固定DNA連接酶,于65℃孵化堿基延伸反應(yīng)。
所述緩沖溶液包含上述四種氨基酸脫氧核苷酸類似物,20mM Tris-HCl,50mM KCl,5mM MgSO4,0.02%CA-630,pH 9.2;
所述DNA連接酶為TherminatorγDNA聚合酶。
(3)基于邊合成邊測(cè)序的原理,當(dāng)DNA模板的互補(bǔ)鏈每結(jié)合上一個(gè)堿基時(shí),該堿基5’-磷酸與聚磷酸之間的鍵被切斷,其所結(jié)合的氨基酸基團(tuán)釋放出來(lái),四種堿基分別釋放不同的氨基酸基團(tuán),釋放出的氨基酸 基團(tuán)進(jìn)入半導(dǎo)體芯片的井1中,將引起流過對(duì)應(yīng)井下金屬氧化物場(chǎng)效應(yīng)晶體管6電流的變化,通過檢測(cè)該電流的變化量并記錄該檢測(cè)井位置,確定氨基酸基團(tuán),進(jìn)而可以確定對(duì)應(yīng)堿基完成排序。
所述氨基酸至少包括一個(gè)氨基酸基團(tuán),四種核苷酸對(duì)應(yīng)四種不同氨基酸基團(tuán),也可以是多個(gè)氨基酸的縮聚物,可以是同種氨基酸的縮聚物或不同氨基酸的縮聚物,四種核苷酸可以分別對(duì)應(yīng)四種不同長(zhǎng)度的氨基酸縮聚物。
所述δ磷酸與氨基之間的鍵用堿性磷酸酶切斷,釋放出游離的氨基酸基團(tuán)。
所述不同的氨基酸基團(tuán)所帶的電荷量以及不同長(zhǎng)度的氨基酸縮聚物所帶的電荷量均不相同。
所述的半導(dǎo)體芯片,包括檢測(cè)井1,井側(cè)壁SiO22,井底二氧化鉭3,金屬氧化物場(chǎng)效應(yīng)晶體管5,及連接二氧化鉭和金屬氧化物場(chǎng)效應(yīng)晶體管柵極的一層或多層鋁、銅或含鋁或銅的金屬混合物4。
(4)根據(jù)由氨基酸基團(tuán)的電荷量引起的流過金屬氧化物場(chǎng)效應(yīng)晶體管的電流變化,得到堿基的排列順序,獲得DNA序列信息。
用氨基酸結(jié)合dNTP進(jìn)行DNA測(cè)序的方法,結(jié)合半導(dǎo)體芯片技術(shù),通過檢測(cè)電流信號(hào)完成基因測(cè)序,沒有顯微鏡和成像裝置,結(jié)構(gòu)簡(jiǎn)單;集成度更高,可同時(shí)多個(gè)檢測(cè);并且可實(shí)現(xiàn)單分子檢測(cè),突破現(xiàn)有光學(xué)測(cè)序的瓶頸,迅速降低測(cè)序成本。
附圖說明
圖1是氨基酸標(biāo)記脫氧核苷酸示意圖;圖2是半導(dǎo)體芯片井示意圖;圖3是四種單氨基酸脫氧核苷酸類似物:分別為賴氨酸四磷酸脫氧腺苷、精氨酸四磷酸脫氧胸苷、谷氨酸四磷酸脫氧胞苷、天冬氨酸脫氧鳥苷;圖4是用香豆素修飾的賴氨酸8聚體、12聚體、16聚體和20聚體四磷酸脫氧核苷酸:香豆素-8聚賴氨酸-4磷酸脫氧腺苷、香豆素-12聚賴氨酸-4磷酸脫氧胸苷、香豆素-16聚賴氨酸-4磷酸脫氧胞苷、香豆素-20聚賴氨酸-4磷酸鳥苷。
具體實(shí)施方式
為了更好的理解本發(fā)明,下面結(jié)合附圖、實(shí)施例進(jìn)一步闡明本發(fā)明,但本發(fā)明的內(nèi)容不僅僅局限于下面的實(shí)例。
實(shí)施例1
本實(shí)施例中,制備四種不同帶電量的氨基酸脫氧核苷酸類似物,賴氨酸四磷酸脫氧腺苷(Lys-dA4P)、精氨酸四磷酸脫氧胸苷(Arg-dT4P)、谷氨酸四磷酸脫氧胞苷(Glu-dC4P)、天冬氨酸四磷酸脫氧鳥苷(Asp-dG4P),如圖3所示。首先通過將氨基酸磷酸化,然后將磷酸化的氨基酸和三磷酸核苷結(jié)合得到所需的四種氨基酸脫氧核苷酸類似物。
選取模板鏈5′-GCACCATATAATCGCTCGCATATTA-3′,在半導(dǎo)體芯片上固定γDNA聚合酶和聚核苷酸模板,加入1X Therminatorγ反應(yīng)緩沖液[50mM KCl,20mM Tris-HCl,5mM MgSO4,0.02%IGEPAL CA-630(pH 9.2)]。模板起始?jí)A基為A,其互補(bǔ)堿基為T,因此移取精氨酸四磷酸脫氧胸苷作為反應(yīng)底物, 然后待Arg-dT4P結(jié)合上母鏈后,用堿性磷酸切斷N-P鍵釋放Arg,釋放的Arg進(jìn)入芯片的檢測(cè)井。氨基酸基團(tuán)所帶的電荷,將改變流過檢測(cè)井下金屬氧化物場(chǎng)效應(yīng)晶體管的電流,帶不同電荷量的氨基酸基團(tuán)導(dǎo)致的電流變化不同,檢測(cè)該電流變化量并記錄井位置就可以對(duì)氨基酸基團(tuán)種類進(jìn)行識(shí)別,傳出信號(hào),獲得堿基信息。
實(shí)施例2
本實(shí)施例中,以賴氨酸的縮聚物作為標(biāo)志物與dNTP結(jié)合形成氨基酸脫氧核苷酸類似物。選擇用香豆素修飾的賴氨酸8聚體、12聚體、16聚體和20聚體與用二氨基庚烷修飾的四磷酸脫氧核苷酸結(jié)合,分別形成香豆素-8聚賴氨酸-4磷酸脫氧腺苷、香豆素-12聚賴氨酸-4磷酸脫氧胸苷、香豆素-16聚賴氨酸-4磷酸脫氧胞苷、香豆素-20聚賴氨酸-4磷酸鳥苷,如圖4所示。
本實(shí)施例其余步驟與實(shí)施例1相似,其余不同點(diǎn)為將單個(gè)氨基酸替換為多個(gè)氨基酸,檢測(cè)時(shí)可以實(shí)現(xiàn)信號(hào)放大的作用及減弱分子的熱運(yùn)動(dòng)速率便于檢測(cè)。
以上所述僅為本發(fā)明的可行實(shí)施例具體說明,該實(shí)施例并非用以限制本發(fā)明的專利范圍,凡依本發(fā)明申請(qǐng)專利范圍所作的均等變化與修飾,皆應(yīng)屬本發(fā)明專利的涵蓋范圍。