本發(fā)明涉及一種檢測染色體異常的方法,尤其涉及一種能夠低成本、快速測定染色體異常、以及染色體異常重組區(qū)域DNA序列并找到重組位點的方法。
背景技術(shù):
出生缺陷嚴(yán)重地影響了人口素質(zhì),給國家、社會和家庭都帶來了巨大的損失。染色體結(jié)構(gòu)和數(shù)量異常是造成出生缺陷的最主要原因,染色體結(jié)構(gòu)異常包括染色體易位和染色體倒位等。
染色體易位是指染色體片段位置的改變。當(dāng)易位發(fā)生在一條染色體內(nèi)時,稱為移位或染色體內(nèi)易位;而當(dāng)易位發(fā)生在兩條同源或非同源染色體之間時,稱為染色體間易位。
染色體倒位是由于同一條染色體上發(fā)生了兩次斷裂,其產(chǎn)生的DNA片斷經(jīng)過180度顛倒、重新連接后造成了染色體倒位。如果倒位發(fā)生在染色體的一條臂上,稱為臂內(nèi)倒位;如果倒位包含了著絲粒區(qū),則稱為臂間倒位(Anthony J.F.Griffiths等人,An Introduction to Genetic Analysis,第八版)。
多年來,核型分析和熒光原位雜交技術(shù)(FISH)是主要的染色體異常分析技術(shù),在鑒定染色體重組大致區(qū)域方面具有一定的成本優(yōu)勢,但產(chǎn)前診斷染色體異常的靈敏度僅有71.9%(楊凌云等人,中國優(yōu)生與遺傳雜志,2009,17(9):1-4)。近年來,隨著下一代高通量測序(Next Generation Sequencing,NGS)技術(shù)的迅速發(fā)展,NGS目前也已經(jīng)被廣泛應(yīng)用于染色體異常的分析,但是由于高等真核染色體中存在大量的重復(fù)序列,而且NGS的序列讀長較短,在處理染色體易位和倒位等復(fù)雜情形時,NGS的作用有限。BioNano和OpGen公司的技術(shù)能夠幫助給出全基因組的框架圖,對于鑒定染色體異常的位置有幫助。但是目前的方案仍然很難快速、廉價地找出染色體異常位置的DNA序列。
技術(shù)實現(xiàn)要素:
針對現(xiàn)有技術(shù)方案無法快速、廉價地測序染色體重組(易位、倒位等)位點DNA序列的問題,本發(fā)明提供了一種新的檢測重組位點DNA序列的方法。
本發(fā)明第一個方面所提供的檢測染色體變異的方法,包括:
根據(jù)CRISPR技術(shù),利用單酶切活性的Cas9酶對染色體DNA進行切割,
將雙鏈DNA解開為單鏈DNA,
NGS平臺進行單鏈DNA定向測序,與正常染色體DNA序列對比,判斷是否存在染色體變異。
本發(fā)明第二個方面是提供一種檢測檢測染色體變異的方法,包括:
根據(jù)CRISPR技術(shù),利用單酶切活性的Cas9酶對染色體DNA進行切割,
將雙鏈DNA解開為單鏈DNA,
NGS平臺進行單鏈DNA定向測序,與正常染色體DNA序列對比,判斷是否存在染色體變異;
如果判定存在變異,確定重組位點的精確區(qū)域,測定精確區(qū)域的重組位點的DNA序列。
本發(fā)明第三個方面是提供一種檢測染色體重組位點DNA序列的方法,包括:
初步定位染色體異位大致區(qū)域,
根據(jù)第一條染色體該區(qū)域的參照序列設(shè)計并制備排序的sgRNA序列,
根據(jù)CRISPR技術(shù),利用單酶切活性的Cas9酶對染色體DNA進行切割,
將雙鏈DNA解開為單鏈DNA,
NGS平臺進行單鏈DNA定向測序,確定重組位點的精確區(qū)域,并測定精確區(qū)域的重組位點的DNA序列。
本發(fā)明第四個方面所提供的檢測染色體間易位重組位點DNA序列的方法,包括:
初步定位染色體重組大致區(qū)域,
根據(jù)第一條染色體重組大致區(qū)域的參照序列設(shè)計并制備排序的第一組sgRNA序列,
根據(jù)CRISPR技術(shù),利用單酶切活性的Cas9酶對染色體DNA進行切割,
將雙鏈DNA解開為單鏈DNA,
NGS平臺進行單鏈DNA定向測序,確定第一條染色體重組位點的精確區(qū)域,并測定精確區(qū)域的重組位點的DNA序列;
根據(jù)第二條染色體重組大致區(qū)域的參照序列設(shè)計并制備排序的第二組sgRNA序列,
根據(jù)CRISPR技術(shù),利用單酶切活性的Cas9酶對染色體DNA進行切割,
將雙鏈DNA解開為單鏈DNA,
NGS平臺進行單鏈DNA定向測序,確定第二條染色體重組位點的精確區(qū)域,并測定精確區(qū)域的重組位點的DNA序列。
本發(fā)明上述內(nèi)容中,所述“大致區(qū)域”的含義對于本領(lǐng)域技術(shù)人員而言是明確的,一般為含有染色體重組位點的較大的區(qū)域,如1-10M區(qū)域,更優(yōu)選為1-8M區(qū)域,更優(yōu)選為1-5M區(qū)域。
本發(fā)明上述內(nèi)容中,所述“精確區(qū)域”的含義對于本領(lǐng)域技術(shù)人員而言是明確的,一般為含有染色體重組位點的較小區(qū)域,如≤20kb,更優(yōu)選為≤15kb,更優(yōu)選為≤10kb,更優(yōu)選為≤5kb,更優(yōu)選為≤1kb。
其中,本發(fā)明上述內(nèi)容中,初步定位染色體重組大致區(qū)域的方法,可以是選自核型分析、FISH、BioNano等技術(shù)。
所述初步定位染色體重組大致區(qū)域步驟中,還可以包括染色體異常類型的判斷。
其中,本發(fā)明所述方法的一種優(yōu)選實施例中,在染色體DNA切割后還可以包括利用DNA缺口平移技術(shù)在缺口處摻入堿基類似物的步驟,并在雙鏈DNA解開后利用堿基類似物的特征純化單鏈DNA。
其中,本發(fā)明上述內(nèi)容中,所述“堿基類似物”的含義對于本領(lǐng)域技術(shù)人員而言是明確的,指的是化學(xué)結(jié)構(gòu)與堿基成分類似、能夠替代正常堿基插入DNA分子中的化合物,如8-吖鳥嘌呤、6-巰基嘌呤、2-氨基嘌呤、5-溴尿嘧啶、5-氟尿嘧啶、5-溴去氧尿核苷、馬來酰肼、丙烯酰胺基修飾的dNTP、疊氮化修飾的dNTP、地高辛修飾的dNTP、Biotin修飾的dNTP、5-羥甲基胞嘧啶中的任意一種或幾種,更優(yōu)選為Biotin修飾的dGTP。
其中,本發(fā)明所述方法的一種優(yōu)選實施例中,在NGS平臺進行單鏈DNA定向測序后,還可以包括利用現(xiàn)有的分子生物學(xué)技術(shù)來精確測定目標(biāo)序列的步 驟。其中,所述現(xiàn)有的分子生物學(xué)技術(shù)可以是PCR技術(shù)、以及已知的其他測序技術(shù)。
本發(fā)明可通過比較成熟的現(xiàn)有技術(shù),低成本條件下分析染色體重組的大致區(qū)域,并利用Cas9體外多點單鏈切割技術(shù),有效地克服NGS讀長較短等缺點,從而能夠直接利用NGS平臺測序,極大地降低了測序成本。
本發(fā)明方法不僅能夠確定染色體倒位、易位等信息,還能夠?qū)δ康膮^(qū)域的DNA序列進行精確測定。相比于傳統(tǒng)的染色體異常檢測手段,該方法能夠獲得更多的DNA序列信息。
附圖說明
圖1為本發(fā)明實施例1中染色體倒位區(qū)域DNA序列測定方法的流程示意圖;
圖2為本發(fā)明實施例2中染色體易位區(qū)域DNA序列測定方法的流程示意圖。
具體實施方式
下面結(jié)合附圖,對本發(fā)明所述檢測重組位點DNA序列的方法進行詳細(xì)的介紹和描述,。
實施例1:
(1)用經(jīng)典的核型分析、FISH、BioNano等技術(shù)確定染色體異常的狀況(包括在那條染色體上、何種異常、大概位置),如圖1所示,染色體異常為染色體倒位。
定位到染色體倒位位點的大致的區(qū)域(如1-5M的區(qū)域)。
(2)針對該區(qū)域設(shè)計排序的sgRNA序列,并進行體外制備sgRNA。
(3)抽提染色體DNA;根據(jù)CRISPR技術(shù),利用單酶切活性(如D10A或H840A)的Cas9,在體外對染色體進行切割。
(4)滅活Cas9酶,利用DNA缺口平移技術(shù)在缺口處摻入堿基類似物(如Biotin修飾的dGTP)。
(5)將DNA隨機打斷;將雙鏈解開變?yōu)閱捂淒NA,并利用堿基類似物的特征純化單鏈DNA。
(6)利用NGS平臺進行單鏈DNA定向測序。
(7)序列分析,鎖定重組位點的精確區(qū)域(如<10kb)。
(8)若(7)仍未找到精確的重組位點的序列,則可以在(7)基礎(chǔ)上,利用現(xiàn)有成熟的分子生物學(xué)技術(shù)(PCR、測序等)來精確測定目標(biāo)序列。
實施例2:
(1)用經(jīng)典的核型分析、FISH、BioNano等技術(shù)確定染色體異常的狀況(包括在那條染色體上,何種異常,大概位置),如圖2所示,染色體異常為染色體間易位。
定位到染色體倒位位點的大致的區(qū)域(如1-5M的區(qū)域)。
(2)針對第一條染色體c1區(qū)域設(shè)計排序的sgRNA序列,并進行體外制備sgRNA。
(3)抽提染色體DNA;根據(jù)CRISPR技術(shù),利用單酶切活性(如D10A或H840A)的Cas9,在體外對染色體進行切割。
(4)滅活Cas9酶,利用DNA缺口平移技術(shù)在缺口處摻入堿基類似物(如Biotin修飾的dGTP)。
(5)將DNA隨機打斷;將雙鏈解開變?yōu)閱捂淒NA,并利用堿基類似物的特征純化單鏈DNA。
(6)利用NGS平臺進行單鏈DNA定向測序。
(7)序列分析,鎖定重組位點的精確區(qū)域(如<10kb);
(8)然后針對第二條染色體c2區(qū)域設(shè)計排序的sgRNA序列,并進行體外制備sgRNA,重復(fù)上述(2)-(7)的步驟。
(9)若(7)或(8)中仍未找到精確的重組位點的序列,則可以在(7)或(8)基礎(chǔ)上,利用現(xiàn)有成熟的分子生物學(xué)技術(shù)(PCR、測序等)來精確測定目標(biāo)序列。
CRISPR/Cas9是細(xì)菌和古細(xì)菌在長期演化過程中形成的一種適應(yīng)性免疫防御,可用來對抗入侵的病毒及外源DNA(Horvath,P.,and Barrangou,R.(2010).CRISPR/Cas,the immune system of bacteria and archaea.Science 327,167–170)。CRISPR/Cas9系統(tǒng)通過將入侵噬菌體和質(zhì)粒DNA的片段整合到CRISPR中,并利用相應(yīng)的CRISPR RNAs(crRNAs)來指導(dǎo)同源序列的降解,從而提供免疫性,此系統(tǒng)的工作原理是crRNA(CRISPR-derived RNA)通過堿基配對與tracrRNA(trans-activating RNA)結(jié)合形成tracrRNA/crRNA復(fù)合 物,此復(fù)合物引導(dǎo)核酸酶Cas9蛋白在與crRNA配對的序列靶位點剪切雙鏈DNA。而通過人工設(shè)計這兩種RNA,可以改造形成具有引導(dǎo)作用的sgRNA(short guide RNA),足以引導(dǎo)Cas9對DNA的定點切割(Jinek,M.,Chylinski,K.,Fonfara,I.,Hauer,M.,Doudna,J.A.,and Charpentier,E.(2012).A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.Science 337,816–821)。
Cas9含有在氨基末端的RuvC和蛋白質(zhì)中部的HNH兩個獨特的活性結(jié)構(gòu),在crRNA成熟和雙鏈DNA剪切中發(fā)揮作用。Cas9中的HNH活性位點剪切crRNA的互補DNA鏈,RuvC活性位點剪切非互補鏈,最終引入DNA雙鏈斷裂(DSB)。對其中的一個結(jié)構(gòu)域進行突變(如RuvC1的D10A和HNH結(jié)構(gòu)域的H840A)后,突變后的Cas9便喪失對應(yīng)的活力(Jinek,M.,Chylinski,K.,Fonfara,I.,Hauer,M.,Doudna,J.A.,and Charpentier,E.(2012).A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.Science 337,816–821)。目前,隨著大量工作的突破,Cas9的體外切割體系已經(jīng)非常成熟(例如,sgRNA的體外制備技術(shù)非常方便且NEB公司已經(jīng)開始出售Cas9酶)。
根據(jù)上述實施例可以看出,本發(fā)明具有如下優(yōu)點:
1、由于目前的染色體核型分析、FISH等技術(shù)比較成熟,若只需要鑒定染色體重組的大致區(qū)域,成本較低。NGS的測序技術(shù)也比較成熟,若能直接利用NGS平臺,則檢測過程不僅快速,而且便宜。本發(fā)明中,利用了Cas9體外多點單鏈切割技術(shù)、切口平移技術(shù)等進行單鏈DNA標(biāo)記,然后引入NGS測序技術(shù),極大地降低了測序成本,并能夠有效地克服NGS讀長較短等缺點。
2、結(jié)合NGS測序技術(shù),該方法不僅能夠確定染色體倒位、易位等信息,還能夠?qū)δ康膮^(qū)域的DNA序列進行精確測定。相比于傳統(tǒng)的染色體異常檢測手段,該方法能夠獲得更多的DNA序列信息。
以上對本發(fā)明的具體實施例進行了詳細(xì)描述,但其只是作為范例,本發(fā)明并不限制于以上描述的具體實施例。對于本領(lǐng)域技術(shù)人員而言,任何對本發(fā)明進行的等同修改和替代也都在本發(fā)明的范疇之中。因此,在不脫離本發(fā)明的精神和范圍下所作的均等變換和修改,都應(yīng)涵蓋在本發(fā)明的范圍內(nèi)。