本發(fā)明涉及生物
技術(shù)領(lǐng)域:
,涉及基因組序列分析領(lǐng)域,具體涉及一種鑒定胚胎平衡易位斷裂點和平衡易位攜帶狀態(tài)的方法。
背景技術(shù):
:在生物醫(yī)學(xué)、生殖遺傳學(xué)的科學(xué)研究及臨床應(yīng)用領(lǐng)域,平衡易位是一種非常常見的新生兒染色體結(jié)構(gòu)異常缺陷,大約占新生兒出生的1/500-1/625。平衡易位攜帶者通常表型正常,也有一部分有微重復(fù)、缺失、基因損壞等遺傳學(xué)變異,從而導(dǎo)致自閉、智障、先天畸形等疾病。平衡易位攜帶者在生育后代時,更容易產(chǎn)生不平衡的配子,從而導(dǎo)致習(xí)慣性流產(chǎn)甚至不孕不育。因此,為平衡易位攜帶者后代阻斷平衡易位,挑選、鑒定出不攜帶平衡易位的胚胎非常有必要。目前鑒定平衡易位的方法主要有:比較基因組雜交(comparativegenomichybridization,CGH),熒光原位雜交(fluorescenceinsituhybridization,FISH),SNP芯片(SNParray),顯微切割結(jié)合二代測序(MicroSeq-PGD)等技術(shù)。然而,比較基因組雜交技術(shù)分辨率比較低,Mb級,通量低,成本高;熒光原位雜交,只針對特定位置,分辨率低,探針雜交效率不穩(wěn)定,因為平衡易位幾乎涉及每條染色體的每條區(qū)帶,所以每位平衡易位攜帶者都要單獨設(shè)計探針,所以會很耗時,成本高,不能作為一個通用檢測技術(shù);SNP芯片是針對全基因組設(shè)計的,SNP分布不會絕對均一,所以對于平衡易位斷裂點周圍可用于連鎖分析的有效位點不確定,會導(dǎo)致無法區(qū)分是否為平衡易位攜帶的胚胎。除上述技術(shù)上的缺陷,以上檢測技術(shù)都不能精準(zhǔn)的確定平衡易位斷裂點位置,如果斷裂點位置不夠精確,超出一定范圍,由于重組互換,會導(dǎo)致平衡易位攜帶/不攜帶的胚胎判斷錯誤。顯微切割結(jié)合二代測序(MicroSeq-PGD)的技術(shù)雖然可以精準(zhǔn)的確定平衡易位斷裂點位置,但需經(jīng)過細(xì)胞培養(yǎng)、顯微切割等階段,操作復(fù)雜,檢測周期非常長,價格昂貴,對于人員、儀器要求高,不能大規(guī)模推廣。因此,本領(lǐng)域迫切需要開發(fā)一種能夠更有效綜合鑒定胚胎平衡易位的方法,提高判斷平衡易位的精準(zhǔn)性。技術(shù)實現(xiàn)要素:針對現(xiàn)有技術(shù)的不足及實際的需求,本發(fā)明提供一種鑒定胚胎平衡易位斷裂點和平衡易位攜帶狀態(tài)的方法,所述方法既可以精準(zhǔn)確定平衡易位斷裂點位置,又能利用少量SNP位點準(zhǔn)確的判斷、分型,鑒定出不攜帶平衡易位的胚胎。為達此目的,本發(fā)明采用以下技術(shù)方案:第一方面,本發(fā)明提供一種確定胚胎平衡易位斷裂點的方法,包括如下步驟:(1)獲取胚胎待測樣本和父母DNA;(2)對待測樣本進行擴增,構(gòu)建文庫后測序;(3)將步驟(2)獲得的基因組序列與參考基因組進行比對,從而獲得基因組序列在參考基因組上的位置信息;(4)將所述的參考基因組分成N個區(qū)域片段,其中每個區(qū)域片段為一個窗口,計算每個窗口的拷貝數(shù);(5)確定正??截悢?shù)的閾值范圍,逐個計算每個窗口及周圍窗口拷貝數(shù)的三均值Mi,將Mi不落在閾值范圍的窗口記錄下來,連續(xù)的窗口合并,直到遇到正常窗口;(6)將步驟(5)連續(xù)的窗口定義為一級區(qū)域,繼續(xù)計算一級區(qū)域每個窗口及周圍窗口的三均值Mnps,第一個窗口為第1斷點bp1,每遇到正常和異常轉(zhuǎn)換的窗口,為斷點bpi;(7)每兩個斷點之間定義為二級區(qū)域,繼續(xù)計算二級區(qū)域每個窗口的三均值Mj,將Mj落在閾值范圍之外的窗口即為精確的拷貝數(shù)變異區(qū)域,所述區(qū)域的起始和終止的位置即為拷貝數(shù)變異的起始和終止斷點;(8)選取多個拷貝數(shù)異常的胚胎,用步驟(1)-(7)計算每個胚胎的兩條染色體平衡易位的斷裂點,分別計算兩條染色體平衡易位斷裂點的三均值,即為胚胎精確的平衡易位的斷裂點;其中,所述i和j獨立地為1至N的任意正整數(shù)。根據(jù)本發(fā)明,步驟(1)所述的待測樣本為胚胎的活檢細(xì)胞,所述活檢細(xì)胞為胚胎發(fā)育到卵裂球時期或囊胚時期取下的外胚層細(xì)胞,所述外胚層細(xì)胞可以是1個也可以是多個滋養(yǎng)外胚層細(xì)胞。根據(jù)本發(fā)明,所述父母DNA為能夠提取DNA的任何人源樣本都是可行的,在此不做特殊限定,本領(lǐng)域技術(shù)人員可以根據(jù)實驗需要進行提取,本發(fā)明的父母DNA選取來自外周血、淋巴液、組織細(xì)胞、頭發(fā)或口腔黏膜細(xì)胞中的任意一種或至少兩種的組合,優(yōu)選為外周血。根據(jù)本發(fā)明,步驟(2)所述的擴增為單細(xì)胞擴增,通過單細(xì)胞擴增對活檢細(xì)胞中的微量核酸進行擴增,以獲得更多的核酸用于后續(xù)分析。根據(jù)本發(fā)明,所述單細(xì)胞擴增為能夠進行單細(xì)胞擴增的方法都是可行的,在此不做特性限定,本領(lǐng)域技術(shù)人員可以根據(jù)實驗需要進行選擇,本發(fā)明采用擴增前引物延伸PCR(PrimerextensionpreamplificationPCR,PEP-PCR)、退變寡核苷酸引物PCR(Degenerateoligonucleotideprimer-PCR,DOP-PCR)、多重置換擴增技術(shù)(MultipleDisplacementAmplification,MDA)或多次退火環(huán)狀循環(huán)擴增技術(shù)(MultipleAnnealingandLoopingBasedAmplificationCycles,MALBAC)中的任意一種或至少兩種的組合,優(yōu)選為多次退火環(huán)狀循環(huán)擴增技術(shù)。根據(jù)本發(fā)明,步驟(2)所述的測序?qū)U增后的樣本進行文庫構(gòu)建后,采用高通量測序平臺進行測序,所述高通量測序平臺為第二代測序平臺,本領(lǐng)域的第二代測序平臺都是可行的,在此不做特殊限定,本領(lǐng)域技術(shù)人員可以根據(jù)需要進行選擇,本發(fā)明可采用Illumina公司的GA、GAII、GAIIx、HiSeq1000/2000/2500/3000/4000、XTen、XFive、NextSeq500/550、MiSeq、MiSeqDx、MiSeqFGx、MiniSeq、NovaSeq5000/6000;AppliedBiosystems的SOLiD,Roche的454FLX,ThermoFisherScientific(LifeTechnologies)的IonTorrent、IonPGM、IonProtonI/II,華大基因的BGISEQ1000、BGISEQ500、BGISEQ100、BGISEQ50,博奧生物集團的BioelectronSeq4000,中山大學(xué)達安基因股份有限公司的DA8600,貝瑞和康的NextSeqCN500,紫鑫藥業(yè)旗下子公司中科紫鑫的BIGIS,華因康基因HYK-PSTAR-IIA中的任意一種,本發(fā)明優(yōu)選采用Illumina公司的HiSeq2500高通量測序平臺。優(yōu)選地,所述測序類型為單端測序和/或雙端測序,優(yōu)選為單端測序。根據(jù)本發(fā)明,所述測序的長度為不小于30bp,例如可以是是30bp、40bp、50bp、80bp、100bp、150bp、300bp、500bp,優(yōu)選為50bp,以及上述數(shù)值之間的具體點值,限于篇幅及出于簡明的考慮,本發(fā)明不再窮盡列舉所述范圍包括的具體點值。根據(jù)本發(fā)明,所述測序的深度為不小于基因組的0.1倍,例如可以是是0.1倍、0.5倍、1倍、2倍、5倍、10倍、30倍、50倍、100倍,優(yōu)選為基因組的0.1倍,以及上述數(shù)值之間的具體點值,限于篇幅及出于簡明的考慮,本發(fā)明不再窮盡列舉所述范圍包括的具體點值。優(yōu)選地,本發(fā)明中測序采用MALBAC單細(xì)胞擴增方法,Illumina公司的HiSeq2500高通量測序平臺,測序類型為單端測序,測序長度50bp,測序深度為基因組的0.1倍。根據(jù)本發(fā)明,所述參考基因組包括全基因組,所述參考基因組的覆蓋率達到全基因組的50%以上,例如可以是50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%,優(yōu)選為60%以上,進一步優(yōu)選為70%以上,再優(yōu)選為80%以上,最優(yōu)選為95%以上,以及上述數(shù)值之間的具體點值,限于篇幅及出于簡明的考慮,本發(fā)明不再窮盡列舉所述范圍包括的具體點值。所述參考基因組為全基因組。參考基因組通常選擇已被公認(rèn)確定的序列,如人的基因組可為NCBI或UCSC的hg18(GRCh18)、hg19(GRCh19)或hg38(GRCh38)。根據(jù)本發(fā)明,所述將基因組序列與參考基因組進行比對,所述比對采用本領(lǐng)域的可進行比對的軟件都是可行的,可用任何一種免費或商業(yè)軟件,在此不做特殊限定,本領(lǐng)域技術(shù)人員可根據(jù)需要進行選擇,例如可以是BWA(Burrows-WheelerAlignmenttool)、SOAPaligner/soap2(ShortOligonucleotideAnalysisPackage)、Bowtie/Bowtie2中的任意一種。根據(jù)本發(fā)明,步驟(4)所述的窗口的長度為1×102-1×106,例如可以是1×102、2×102、5×102、8×102、1×103、5×103、8×103、1×104、5×104、1×105、5×105、8×105、1×106,以及上述數(shù)值之間的具體點值,限于篇幅及出于簡明的考慮,本發(fā)明不再窮盡列舉所述范圍包括的具體點值。根據(jù)本發(fā)明,所述步驟(4)還包括校正每個窗口的拷貝數(shù),計算每個窗口校正后的拷貝數(shù)的步驟,所述校正每個窗口拷貝數(shù)的方法為本領(lǐng)域可進行校正窗口拷貝數(shù)的方法都是可行的,在此不做特殊限定,本領(lǐng)域技術(shù)人員可以根據(jù)需要進行選擇,本發(fā)明采用Loess校正。根據(jù)本發(fā)明,根據(jù)測得的序列在基因組上的位置,統(tǒng)計落到每個窗口的序列數(shù)目、堿基分布、參考基因組的堿基分布,根據(jù)每個窗口的序列及堿基GC含量,校正每個窗口的拷貝數(shù),計算每個窗口校正后的拷貝數(shù)。根據(jù)本發(fā)明,步驟(5)所述的閾值范圍為N–σ到N+σ之間,其中,所述N為待測樣本的倍體,所述σ為設(shè)定的拷貝數(shù)正常波動范圍的預(yù)定值,所述預(yù)定值σ為0.05-0.2,例如可以是0.05、0.06、0.08、0.1、0.12、0.15、0.18、0.2,以及上述數(shù)值之間的具體點值,限于篇幅及出于簡明的考慮,本發(fā)明不再窮盡列舉所述范圍包括的具體點值。以人為例,人是二倍體,則N=2,設(shè)定正常波動范圍的預(yù)定值(σ)為0.05,正常拷貝數(shù)的閾值范圍為(2–0.05,2+0.05)。優(yōu)選地,步驟(5)所述的閾值范圍為N-m×SD到N+m×SD之間,其中,所述N為待測樣本的倍體,所述m為1-3中的任意整數(shù),所述SD為待測樣本所有窗口拷貝數(shù)的標(biāo)準(zhǔn)差。本發(fā)明中,計算拷貝數(shù)時,基因組分成很多窗口,每個窗口都有一個拷貝數(shù),大部分窗口拷貝數(shù)是正常的,其數(shù)值在2上下波動,符合正態(tài)分布,m是標(biāo)準(zhǔn)差的倍數(shù),理論上,m=1時,68.3%的數(shù)落在[N-SD,N+SD];m=2時,95.5%的數(shù)落在[N-2×SD,N+2×SD];m=3時,99.7%的數(shù)落在[N-3×SD,N+3×SD];m是一個統(tǒng)計學(xué)概念,本領(lǐng)域技術(shù)人員可以根據(jù)實際情況進行選擇。以人為例,正??截悢?shù)的閾值范圍可以為(2–2×SD,2+2×SD)。本發(fā)明中,兩種閾值都可以用于后續(xù)的實驗,“N–σ到N+σ”這種閾值范圍的σ一般根據(jù)大量樣本拷貝數(shù)分布特點經(jīng)驗得來,適用于大部分情況;“N-m×SD到N+m×SD”這種閾值范圍的SD是根據(jù)待測樣本本身拷貝數(shù)的分布特點算出來的,適用范圍更廣,適用于全部情況。根據(jù)本發(fā)明,步驟(5)所述的周圍窗口的數(shù)量為10-100,例如可以是10、12、15、20、30、40、50、60、70、80、90、100,優(yōu)選為10-60,進一步優(yōu)選為10,以及上述數(shù)值之間的具體點值,限于篇幅及出于簡明的考慮,本發(fā)明不再窮盡列舉所述范圍包括的具體點值。優(yōu)選地,所述三均值的計算公式為:M=Q1/4+M/2+Q3/4,其中,Q1為下四分位數(shù),M為中位數(shù),Q3為上四分位數(shù)。優(yōu)選地,步驟(6)所述的周圍窗口的數(shù)量為3-10,例如可以是3、4、5、6、7、8、9、10,優(yōu)選為3-8,進一步優(yōu)選為3-5,以及上述數(shù)值之間的具體點值,限于篇幅及出于簡明的考慮,本發(fā)明不再窮盡列舉所述范圍包括的具體點值。步驟(6)所述的每遇到正常和異常轉(zhuǎn)換的窗口具體為第一個窗口為第1斷點bp1,逐一計算每個窗口,當(dāng)出現(xiàn)至少連續(xù)2個Mnps落在異常范圍時,記錄該窗口為第2斷點bp2,繼續(xù)掃描,直到出現(xiàn)至少連續(xù)2個Mnps回到正常范圍時,記錄該窗口為第3斷點bp3,這樣每遇到正常和異常轉(zhuǎn)換的窗口,記錄一個斷點bpi,直到一級區(qū)域的最后一個窗口,其中,所述i為1至M的任意正整數(shù)。根據(jù)本發(fā)明,對于非平衡易位的配子導(dǎo)致的胚胎拷貝數(shù)變異,檢測到的斷點即為平衡易位斷裂點。優(yōu)選地,步驟(8)所述的多個胚胎的數(shù)量為大于5的正整數(shù)。步驟(8)所述的胚胎平衡易位的斷裂點具體為通過IVF會得到n個胚胎,其中拷貝數(shù)異常(包括活檢不合格的廢胚)的胚胎n’個,用上述同樣的方法檢測,其中選取n”(n”為小于等于n’的正整數(shù),優(yōu)選n”=n’)個拷貝數(shù)異常胚胎,確定兩條相互易位的染色體斷裂點,定義兩條相互易位的染色體分別為chrM和chrN,n”個拷貝數(shù)異常的胚胎,在chrM上會得到nM”個的斷裂點位置,在chrN上會得到nN”個的斷裂點位置,分別計算兩條染色體斷裂點位置的三均值,得到bpchrM和bpchrN即為兩條相互易位的染色體的精確斷裂點的位置。第二方面,本發(fā)明提供一種鑒定胚胎平衡易位攜帶狀態(tài)的方法,包括如下步驟:(1’)采用如第一方面所述的方法確定胚胎平衡易位斷裂點;(2’)檢測斷裂點周圍的SNP;(3’)胚胎單倍型分析:挑選有效的SNP,根據(jù)其中一方的SNP基因型進行分型,通過拷貝數(shù)正常的胚胎構(gòu)建另外一方的單倍型,將拷貝數(shù)異常的胚胎進行單倍型分型后進行比較,確定單倍型的分型結(jié)果;(4’)確定胚胎攜帶狀態(tài):將拷貝數(shù)正常的胚胎進行單倍型分型,再將分型結(jié)果分類,分成易位攜帶和不攜帶兩類,確定單倍型的分型結(jié)果;(5’)確定胚胎攜帶狀態(tài):將拷貝數(shù)正常的胚胎進行單倍型分型,再與步驟(4’)所述單倍型的分型結(jié)果進行比對,確定胚胎易位攜帶狀態(tài)。根據(jù)本發(fā)明,步驟(2’)所述的斷裂點周圍的長度為2×105-5×106,例如可以是2×105、3×105、4×105、5×105、6×105、7×105、8×105、9×105、1×106、2×106、3×106、4×106、5×106,優(yōu)選為2×105-1×106,以及上述數(shù)值之間的具體點值,限于篇幅及出于簡明的考慮,本發(fā)明不再窮盡列舉所述范圍包括的具體點值。優(yōu)選地,步驟(2’)所述的SNP的數(shù)量一般檢測30個以上,每個胚胎上的可用位點約占1/3,10個以上可用位點就可以確定單倍型連鎖關(guān)系,本發(fā)明中所述SNP的數(shù)量為10-500,例如可以是10、20、30、40、50、60、80、100、120、130、150、200、250、300、350、400、450、500,優(yōu)選為30-100,以及上述數(shù)值之間的具體點值,限于篇幅及出于簡明的考慮,本發(fā)明不再窮盡列舉所述范圍包括的具體點值。根據(jù)本發(fā)明,所述檢測斷裂點周圍的SNP的方法為本領(lǐng)域公知的方法,在此不做特殊限定,本領(lǐng)域技術(shù)人員可以根據(jù)需要進行選擇,本發(fā)明采用設(shè)計探針芯片捕獲測序、設(shè)計引物對擴增子進行一代測序或設(shè)計引物對擴增子進行二代測序中的任意一種或至少兩種的組合。本發(fā)明中,所述確定基因型的方法為一代測序根據(jù)測序結(jié)果的峰圖確定;二代測序,經(jīng)過上述步驟(測序、將基因組序列與參考基因組進行比對)后,用分析軟件分析,分析軟件為SAMtools、GATK、Varscan等軟件中的任意一種或至少兩種的組合。根據(jù)本發(fā)明,所述有效的SNP為父方母方中有一方為純合子有一方為雜合子,所述有效SNP的數(shù)量為10-500。本發(fā)明中,所述挑選有效SNP的具體過程為:被檢測物種為人,人是二倍體,胚胎的父母中有一方為易位攜帶者,一方為正常(不攜帶者)。易位攜帶者M和N號染色體部分發(fā)生相互易位,同時含有一條正常的染色體,所以會有正常染色體chrM、易位衍生染色體der(chrM)、正常染色體chrN、易位衍生染色體der(chrN);正常一方有正常染色體chrM’、chrM”、chrN’、chrN”。根據(jù)孟德爾遺傳規(guī)律和連鎖交換規(guī)律,在斷裂點上游和下游選取可以有效區(qū)分正常染色體和易位衍生染色體單倍型的SNP。本發(fā)明中,所述胚胎攜帶狀態(tài)的確定的具體結(jié)果為:根據(jù)兩條染色體單倍型分型的結(jié)果,檢驗每個拷貝數(shù)正常的胚胎。判斷遺傳自(父母中)易位攜帶方的染色體,如果這條染色體與易位染色體相同,則胚胎攜帶狀態(tài)為易位攜帶;如果這條染色體與正常染色體相同,則胚胎攜帶狀態(tài)為不攜帶(正常);從而確定為平衡易位攜帶胚胎。根據(jù)本發(fā)明,所述鑒定胚胎平衡易位攜帶狀態(tài)的方法,包括如下步驟:(1)獲取胚胎待測樣本和父母DNA;(2)對待測樣本進行擴增,構(gòu)建文庫后測序;(3)將步驟(2)獲得的基因組序列與參考基因組進行比對,從而獲得基因組序列在參考基因組上的位置信息;(4)將所述的參考基因組分成N個區(qū)域片段,其中每個區(qū)域片段為一個窗口,計算每個窗口的拷貝數(shù);(5)確定正??截悢?shù)的閾值范圍,逐個計算每個窗口及周圍窗口拷貝數(shù)的三均值Mi,將Mi不落在閾值范圍的窗口記錄下來,連續(xù)的窗口合并,直到遇到正常窗口;(6)將步驟(5)連續(xù)的窗口定義為一級區(qū)域,繼續(xù)計算一級區(qū)域每個窗口及周圍窗口的三均值Mnps,第一個窗口為第1斷點bp1,每遇到正常和異常轉(zhuǎn)換的窗口,為斷點bpi;(7)每兩個斷點之間定義為二級區(qū)域,繼續(xù)計算二級區(qū)域每個窗口的三均值Mj,將Mj落在閾值范圍之外的窗口即為精確的拷貝數(shù)變異區(qū)域,所述區(qū)域的起始和終止的位置即為拷貝數(shù)變異的起始和終止斷點;(8)選取多個拷貝數(shù)異常的胚胎,用步驟(1)-(7)計算每個胚胎的兩條染色體平衡易位的斷裂點,分別計算兩條染色體平衡易位斷裂點的三均值,即為胚胎精確的平衡易位的斷裂點;(9)檢測斷裂點周圍的SNP;(10)胚胎單倍型分析:挑選有效的SNP,根據(jù)其中一方的SNP基因型進行分型,通過拷貝數(shù)正常的胚胎構(gòu)建另外一方的單倍型,將拷貝數(shù)異常的胚胎進行單倍型分型后進行比較,確定單倍型的分型結(jié)果;(11)確定胚胎攜帶狀態(tài):將拷貝數(shù)正常的胚胎進行單倍型分型,再與步驟(10)所述單倍型的分型結(jié)果進行比對,確定胚胎易位攜帶狀態(tài);其中,所述i和j獨立地為1至N的任意正整數(shù)。與現(xiàn)有技術(shù)相比,本發(fā)明具有如下有益效果:(1)本發(fā)明方法提供了一個精準(zhǔn)確定平衡易位斷裂點位置的方法,使斷裂點判定分辨率大大提高,從而在更精準(zhǔn)有效的區(qū)域內(nèi)檢測SNP,避免重組交換的發(fā)生;(2)本發(fā)明利用胚胎互推的方法,實現(xiàn)了利用少量的胚胎、SNP位點就能準(zhǔn)確的進行單倍型分型,鑒定鑒定胚胎平衡易位攜帶狀態(tài),大大的節(jié)約成本,提高準(zhǔn)確度;(3)本發(fā)明檢測方法適用人群更廣泛,檢測流程上操作更加簡單,檢測周期更短。附圖說明圖1是本發(fā)明鑒定胚胎平衡易位攜帶狀態(tài)的方法的流程圖。具體實施方式為更進一步闡述本發(fā)明所采取的技術(shù)手段及其效果,以下結(jié)合附圖并通過具體實施方式來進一步說明本發(fā)明的技術(shù)方案,但本發(fā)明并非局限在實施例范圍內(nèi)。本發(fā)明已經(jīng)應(yīng)用到30個例子,經(jīng)臨床驗證,檢測結(jié)果和實際臨床結(jié)果符合率為100%。為了使本發(fā)明的用法和效果更加易于理解和掌握,下面將舉一個實例進行進一步的闡述。實施的簡要流程圖如圖1所示,詳細(xì)實施過程如下:本實施例中,對某平衡易位攜帶者胚胎及家系樣本進行檢測,鑒定結(jié)果與臨床核型檢測的金標(biāo)準(zhǔn)(羊水穿刺驗證)結(jié)果比較。該家系夫婦父方核型正常,母方為chr7與chr16平衡易位攜帶者,核型為46,XX,t(7;16)(p12.3;q22.1)。具體實施過程如下:實施例1平衡易位斷裂點的確定(1)獲取胚胎待測樣本和父母DNA經(jīng)過IVF此家系獲得8個胚胎,胚胎發(fā)育到囊胚時期,每個胚胎活檢取下的3-5個滋養(yǎng)外胚層細(xì)胞。(2)對樣本進行擴增、測序單細(xì)胞擴增采用上海億康醫(yī)學(xué)檢驗所有限公司的多次退火環(huán)狀循環(huán)擴增技術(shù)單細(xì)胞全基因組擴增試劑盒YK001A,按照上海億康醫(yī)學(xué)檢驗所有限公司提供的說明書操作,對胚胎活檢細(xì)胞進行全基因組擴增。測序采用Illumina公司的HiSeq2500高通量測序平臺,按照Illumina公司提供的說明書操作。測序類型為單端(SingleEnd)測序,測序長度50bp,測序深度為基因組的0.1倍。(3)序列比對,進行拷貝數(shù)分析將測序結(jié)果去掉接頭及低質(zhì)量數(shù)據(jù),比對到參考基因組。參考基因組hg19(GRCh19)。比對軟件為BWA(Burrows-WheelerAlignmenttool),采用默認(rèn)參數(shù),將序列比對到參考基因組,得到序列在基因組上的位置,選擇在基因組上唯一比對的序列。將基因組分成長度為5×107bp的窗口。根據(jù)序列在基因組上的位置,統(tǒng)計落到每個窗口的序列數(shù)目、堿基分布、參考基因組的堿基分布。根據(jù)每個窗口的序列及堿基GC含量,校正每個窗口的拷貝數(shù),校正方法為Loess,計算每個窗口校正后的拷貝數(shù)。拷貝數(shù)結(jié)果如表1所示,由于人的基因組非常大,有3×109bp,表1只展示chr7部分區(qū)域拷貝數(shù)情況:表1各胚胎chr7部分區(qū)域拷貝數(shù)(4)精確確定斷裂點的位置經(jīng)以上步驟,得到各窗口的拷貝數(shù)。設(shè)定正??截悢?shù)的范圍:根據(jù)樣本拷貝數(shù)分布特征,計算樣本所有窗口拷貝數(shù)的標(biāo)準(zhǔn)差(StandardDeviation,SD),本實施例SD=0.11,確定正??截悢?shù)的閾值范圍為正常值±2倍標(biāo)準(zhǔn)偏差,范圍為(1.78,2.22)。逐個計算每個窗口及周圍10個窗口拷貝數(shù)的三均值Mi。三均值Mi落在正??截悢?shù)范圍以外的窗口記錄下來,連續(xù)的窗口合并,直到遇到正常窗口。經(jīng)以上計算得到拷貝數(shù)異常的連續(xù)窗口,這些連續(xù)窗口定義為一級區(qū)域,定義一級區(qū)域的第一個窗口為第1斷點bp1,然后計算一級區(qū)域每個窗口及周圍3個窗口的平均值Mnps。逐一計算每個窗口,當(dāng)出現(xiàn)至少連續(xù)2個Mnps落在異常范圍時,記錄該窗口為第2斷點bp2,繼續(xù)掃描,直到出現(xiàn)至少連續(xù)2個Mnps回到正常范圍時,記錄該窗口為第3斷點bp3,這樣每遇到正常和異常轉(zhuǎn)換的窗口,記錄一個斷點bpi,直到一級區(qū)域的最后一個窗口,記錄為bpf。斷點bp1到斷點bpf將一級區(qū)域分成(f–1)個次級片段,定義為二級區(qū)域,計算每個二級區(qū)域窗口拷貝數(shù)的三均值Mj,和拷貝數(shù)正常范圍比較,Mj落在異常范圍的二級區(qū)域即為精確的拷貝數(shù)變異區(qū)域,其中Mj為該區(qū)域的拷貝數(shù),該區(qū)域起始和終止的位置即為拷貝數(shù)變異的起始和終止斷點。對于非平衡的配子導(dǎo)致的胚胎拷貝數(shù)變異,檢測到的斷點即為平衡易位斷裂點。本實施例得到8個胚胎,其中拷貝數(shù)異常4個,分別為E1、E3、E7、E8,用上述同樣的方法檢測,全部選取4個拷貝數(shù)異常胚胎,確定兩條相互易位的染色體斷裂點。4個拷貝數(shù)異常的胚胎,在chr7上得到4個的斷裂點位置,在chr16上同樣得到4個的斷裂點位置,分別計算兩條染色體斷裂點位置的三均值,得到兩條相互易位的染色體的精確斷裂點的位置為:chr7:45,900,001±50,000;chr16:43,100,001±50,000。檢測結(jié)果如表2所示。表2根據(jù)4個拷貝數(shù)異常的斷裂點確定精確斷裂點實施例2胚胎平衡易位攜帶狀態(tài)的確定(1’)從實施例1得到的確定的平衡胚胎平衡易位斷裂點;(2’)檢測斷裂點周圍SNP在距離chr7斷裂點1×106bp的范圍內(nèi)分別檢測胚胎父母、胚胎的61個SNP位點;在距離chr16斷裂點1×106bp的范圍內(nèi)分別檢測胚胎父母、胚胎的63個SNP位點。SNP位點的檢測方法為,設(shè)計引物對擴增子進行二代測序。確定基因型的方法為二代測序,使用分析軟件為SAMtools確定SNP基因型。該家系chr7及chr16斷裂點上下游的SNP結(jié)果如表3和表4所示。表3家系樣本chr7斷裂點上下游SNP基因型SNP編號父方母方E1E2E3E4E5E6E7E81C/CT/TT/CT/CC/CT/CT/CT/CT/CT/C2A/AC/CA/CA/CA/AA/CA/CA/CA/CA/C3G/GT/TT/GT/G--T/GT/GG/GT/G4C/CT/TT/CT/CC/CT/CT/CT/CT/CT/C5G/GA/AA/GA/GG/GA/GA/GA/GA/GA/G6T/TG/GG/TG/TT/TT/TG/TG/TG/TG/T7A/AG/AG/AG/AA/AG/AG/AA/AG/AG/A8G/GG/GG/GG/GG/G-G/GG/GG/GG/G9G/AG/GG/AG/GA/AG/GG/AG/GG/GG/A10A/AC/AC/AA/AA/AA/AA/AC/AA/AC/A11T/GT/GT/GG/GT/T-T/GT/GG/GT/G12G/TG/GG/TG/GT/TG/GG/TG/GG/GG/T13G/GG/GG/GG/GG/GG/GG/GG/GG/GG/G14C/TT/TC/TT/TC/CT/TC/TT/TT/TC/T15G/GG/GG/GG/GG/GG/GG/GG/GG/GG/G16A/AG/AG/AG/AA/AG/AG/AA/AG/AG/A17A/GA/GA/GA/GA/AA/GA/AG/GA/GA/G18T/CT/TT/CT/TC/C-T/CT/TT/TT/C19G/TG/GG/TG/GT/TG/GG/TG/GG/GG/T20G/TG/GG/TG/GT/TG/GG/TG/GG/GG/T21T/GT/TT/GT/TG/GT/TT/GT/TT/TT/G22G/AA/AG/AA/AG/GA/AG/AA/AA/AG/A23T/TC/TC/TT/TT/TT/TT/TC/TT/TC/T24T/TC/TC/TC/TT/TC/TC/TT/TC/TC/T25C/TC/TC/TC/TT/TG/AT/TC/CC/TC/T26T/CT/CT/CT/CC/C-C/C-T/CT/C27G/CG/CG/C---C/CG/GG/CG/C28C/CT/CT/CC/CC/CC/CC/CT/CC/CT/C29T/CT/CT/CT/C-T/CC/CT/TT/CT/C30G/AA/AA/AG/GA/AG/AA/AG/AG/AA/A31G/CG/GG/CG/GG/CG/GG/CG/GG/GG/C32T/CT/CT/CC/CT/TC/CT/CT/CT/CT/C33A/GA/GA/GG/GA/AG/GA/GA/GA/GA/G34C/TC/TC/TC/CT/T-C/TC/TC/TC/T35G/AA/AA/AG/AA/AG/GA/AG/AG/AA/A36G/AA/AA/AG/AA/AG/AA/AG/AG/AA/A37T/TT/AT/AT/AT/T-T/AT/TT/TT/A38C/CT/TT/CT/CT/CT/TT/CT/CT/CT/C39A/AG/GA/GA/GA/GA/GA/GA/GA/GA/G40G/CG/CG/GC/CC/CG/GG/GC/CG/CG/G41G/GG/GG/GG/GG/GG/GG/GG/GG/GG/G42G/AG/AG/GG/AG/AA/AG/GA/AG/AG/G43A/AG/AG/AG/AA/AG/AG/AA/AG/AG/A44T/CT/TT/TT/CT/TT/CT/TT/CT/CT/T45T/GT/TT/TT/GT/T-T/TT/GT/GT/T46A/GG/G--G/G-G/GA/AA/GG/G47T/TT/TT/TT/TT/TT/TT/TT/TT/TT/T48C/CC/CC/CC/CC/CC/CC/CC/CC/CC/C49G/GG/GG/GG/GG/G-G/GG/GG/GG/G50A/GA/GA/AA/GA/G-A/AG/GA/GA/A51A/AA/GA/AA/AA/GA/AA/AA/GA/GA/A52G/GA/AG/AG/AG/G-G/AG/AG/AG/A53G/GG/GG/GG/GG/GG/GG/GG/GG/GG/G54A/AA/GA/GA/GA/AA/GA/GA/AA/GA/G55G/AG/GG/AG/GG/A-G/AG/GG/GG/A56C/CC/TT/TC/TC/C-C/TC/CC/TC/T57G/AG/GG/AG/GG/AG/GG/AG/GG/GG/A58G/TG/GG/TG/GG/TG/GG/TG/GG/GG/T59G/AA/AG/AA/AG/A-G/AA/AA/AG/A60G/AG/AA/AG/AG/A-A/AG/GG/AA/A61C/TC/TC/TC/CT/TC/CC/TC/TC/TC/T“-”:表示該位點未檢測到,后續(xù)表格采用相同的表示方法。表4家系樣本chr16斷裂點上下游SNP基因型SNP編號父方母方E1E2E3E4E5E6E7E81C/CC/TC/CC/TC/TC/TC/TC/CC/CC/C2T/TT/CT/CT/TT/TT/TT/TT/CT/TT/C3T/TC/T--T/T-T/TC/T-C/T4A/AC/C-C/C-C/AC/AC/A-C/A5A/CC/CA/CA/CA/CC/CC/CC/CA/AC/C6A/AG/GA/GA/GA/GA/GA/GA/GA/AA/G7G/GA/GA/GG/GG/GG/GG/GA/GG/GA/G8A/AC/AC/AA/AA/AA/AA/AC/AA/AC/A9T/TA/AT/AT/AT/AT/AT/AT/AT/TT/A10G/GG/GG/GG/GG/G-G/GG/GG/GG/G11C/AC/AC/CC/AC/AA/AA/AC/AC/CC/A12T/GT/GT/GT/TT/TT/GT/GG/GT/TG/G13A/AG/GG/AG/AG/A-G/AG/AA/AG/A14G/TT/TG/TG/TG/TT/TT/TT/TG/GT/T15C/CC/TC/TC/CC/CC/CC/CC/T-C/T16A/GA/GA/GG/GG/GG/GA/GA/AG/GA/A17T/CT/CT/CC/CC/CT/CT/CT/TC/CT/T18C/CC/CC/CC/CC/CC/CC/CC/CC/CC/C19T/TC/TT/TC/TC/TC/TC/TT/TT/TT/T20C/TT/TC/TC/TC/T-T/TT/TC/CT/T21T/TT/AT/TT/AT/A-T/AT/TT/TT/T22T/TC/TT/TC/TC/TC/TC/TT/T-T/T23C/CT/CC/CT/CT/CT/CT/CC/CC/CC/C24A/AC/AA/AC/AC/A-C/AA/AA/AA/A25C/AA/AC/AC/AC/AA/AA/AA/AC/CA/A26C/TT/TC/TC/TC/TT/TT/TT/TC/CT/T27T/GG/GT/GT/GT/GG/GG/GG/GT/TG/G28A/GG/GA/GA/GA/GG/GG/GG/GA/AG/G29C/AC/CC/CC/CC/CC/AC/AC/AC/CC/A30G/TG/GG/GG/GG/G-G/TG/TG/GG/T31G/AA/AA/AA/AA/A-G/AG/AA/AG/A32T/AT/TT/TT/TT/TT/AT/AT/AT/TT/A33A/GA/GG/GG/GA/G-A/G--A/A34C/CC/AC/CC/AC/AC/AC/AC/CC/CC/C35C/TT/TT/TT/TT/TC/CC/TC/TT/TC/C36C/CC/TC/CC/TC/CT/TC/TC/CC/CC/C37C/GC/CG/GC/GC/GC/CC/CC/CC/GC/C38G/AG/GA/AG/AG/AG/GG/GG/GG/AG/G39C/TC/CT/TC/TC/TC/CC/CC/CC/TC/C40G/GG/GG/GG/GG/GG/GG/GG/GG/GG/G41C/CC/CC/CC/CC/C-C/CC/CC/CC/C42A/AG/GA/AA/GG/GG/GG/GG/GA/G-43A/AG/GA/AG/AG/AG/AG/AG/AG/AA/A44C/CC/CC/CC/CC/C-C/CC/CC/CC/C45T/GG/GG/GG/GG/GT/GT/GT/GG/GT/T46T/CC/C-T/TC/C-C/C-T/CC/C47C/TT/TC/CC/TC/TT/TT/TT/TC/TT/T48A/AA/AA/AA/AA/AA/AA/AA/AA/AA/A49T/TT/TT/TT/TT/TT/TT/TT/TT/TT/T50A/AA/AA/AA/AA/A-A/AA/AA/AA/A51A/AA/AA/AA/AA/AA/AA/AA/AA/AA/A52T/TT/TT/TT/TT/TT/TT/TT/TT/TT/T53A/GA/GG/GG/GA/GA/GA/GA/AA/GA/A54G/GG/CG/GG/GG/CG/GG/GG/CG/CG/G55A/GA/G-A/GA/GA/AA/A-G/GA/A56G/CG/GC/CG/CG/CG/GG/GG/GG/CG/G57C/CT/TC/CC/TC/TC/TC/TC/TC/TC/C58A/GA/AA/AA/AA/AA/GA/G-A/AG/G59G/AG/A-G/GG/AG/AG/AA/AG/AA/A60T/TT/TT/TT/TT/TT/TT/TT/TT/TT/T61T/TT/CT/TT/CT/CT/CT/CT/TT/TT/T62T/GT/TG/GT/GT/GT/TT/TT/TT/GT/T63C/CC/TC/CC/TC/TC/TC/TC/CC/CC/C(3’)胚胎單倍型分析根據(jù)孟德爾遺傳規(guī)律和連鎖交換規(guī)律,從表3-4中的SNP中挑選出有效的信息SNP,結(jié)果如表5所示。表5家系樣本斷裂點上下游有效SNP基因型染色體SNP編號父方母方E1E2E3E4E5E6E7E8chr77A/AG/AG/AG/AA/AG/AG/AA/AG/AG/Achr710A/AC/AC/AA/AA/AA/AA/AC/AA/AC/Achr716A/AG/AG/AG/AA/AG/AG/AA/AG/AG/Achr723T/TC/TC/TT/TT/TT/TT/TC/TT/TC/Tchr724T/TC/TC/TC/TT/TC/TC/TT/TC/TC/Tchr728C/CT/CT/CC/CC/CC/CC/CT/CC/CT/Cchr737T/TT/AT/AT/AT/T-T/AT/TT/TT/Achr743A/AG/AG/AG/AA/AA/GG/AA/AG/AG/Achr751A/AA/GA/AA/AA/GA/AA/AA/GA/GA/Achr754A/AA/GA/GA/GA/AA/GA/GA/AA/GA/Gchr756C/CC/TT/TC/TC/C-C/TC/CC/TC/Tchr161C/CC/TC/CC/TC/TC/TC/TC/CC/CC/Cchr162T/TT/CT/CT/TT/TT/TT/TT/CT/TT/Cchr163T/TC/T--T/T-T/TC/T-C/Tchr167G/GA/GA/GG/GG/GG/GG/GA/GG/GA/Gchr168A/AC/AC/AA/AA/AA/AA/AC/AA/AC/Achr1615C/CC/TC/TC/CC/CC/CC/CC/T-C/Tchr1619T/TC/TT/TC/TC/TC/TC/TT/TT/TT/Tchr1621T/TT/AT/TT/AT/A-T/AT/TT/TT/Tchr1622T/TC/TT/TC/TC/TC/TC/TT/T-T/Tchr1623C/CT/CC/CT/CT/CT/CT/CC/CC/CC/Cchr1624A/AC/AA/AA/CC/A-C/AA/AA/AA/Achr1634C/CC/AC/CC/AC/AC/AC/AC/CC/CC/Cchr1636C/CC/TC/CC/TC/CT/TC/TC/CC/CC/Cchr1654G/GG/CG/GG/GG/CG/GG/GG/CG/CG/Gchr1661T/TT/CT/TT/CT/CT/CT/CT/TT/TT/Tchr1663C/CC/TC/CC/TC/TC/TC/TC/CC/CC/Cchr7斷裂點上下游有11個有效SNP,chr16斷裂點上下游有16個有效SNP。對父方的chr7和chr16的SNP基因型進行分型。再根據(jù)拷貝數(shù)正常的胚胎(E2、E4、E5和E6),構(gòu)建母方單倍型。其中,構(gòu)建母方單倍型是通過將拷貝數(shù)正常的胚胎(E2、E4、E5和E6)減去父方的純合子單倍型得到,每個胚胎在chr7上用于單倍型分型的是SNP數(shù)目為9-11,在chr16上用于單倍型分型的是SNP數(shù)目為13-16,合并這些母方單倍型,構(gòu)建母方在chr7單倍型HAchr7和HBchr7,構(gòu)建母方在chr16單倍型HAchr16和HBchr16,詳細(xì)結(jié)果見表6-7所示。表6家系拷貝數(shù)正常胚胎chr7斷裂點上下游單倍型表7家系拷貝數(shù)正常胚胎chr16斷裂點上下游單倍型同上方法,對CNV異常的胚胎(E1、E3、E7和E8)進行單倍型分型,每個胚胎都可以確定chr7/chr16上的單倍型是正常還是易位攜帶,4個胚胎的結(jié)果相互驗證,得到綜合判定結(jié)果,結(jié)果如表8-9所示。表8家系拷貝數(shù)異常胚胎chr7斷裂點上下游單倍型判定結(jié)果“N/A”:表示該位點不可用于連鎖分析,后續(xù)表格采用相同的表示方法。表9家系拷貝數(shù)異常胚胎chr16斷裂點上下游單倍型判定結(jié)果綜合判定結(jié)果和HAchr7、HBchr7、HAchr16、HBchr16的單倍型分型結(jié)果比較,判定哪個單倍型代表“正?!?,哪個單倍型代表“易位攜帶”。如表10所示,4個異常胚胎一致判定HAchr7為正常單倍型,HBchr7為易位攜帶單倍型;同樣,判定HAchr16為正常單倍型,HBchr16為易位攜帶單倍型。表10家系單倍型分型結(jié)果(4’)確定胚胎攜帶狀態(tài)根據(jù)上述步驟的單倍型的分型結(jié)果,判定拷貝數(shù)正常的胚胎E2、E4、E5和E6的攜帶狀態(tài)。判定結(jié)果如表11所示,結(jié)果顯示胚胎E2、E4、E5均為正常(不攜帶易位)胚胎。用本發(fā)明方法挑選出1個正常(不攜帶易位)的胚胎,鑒定過程結(jié)束。胚胎植入后,孕婦正常受孕,經(jīng)羊水穿刺檢測確認(rèn)該胎兒核型正常。表11家系胚胎攜帶狀態(tài)確定結(jié)果染色體胚胎chr7chr16E2正常正常E4正常正常E5正常正常E6攜帶攜帶申請人聲明,本發(fā)明通過上述實施例來說明本發(fā)明的詳細(xì)方法,但本發(fā)明并不局限于上述詳細(xì)方法,即不意味著本發(fā)明必須依賴上述詳細(xì)方法才能實施。所屬
技術(shù)領(lǐng)域:
的技術(shù)人員應(yīng)該明了,對本發(fā)明的任何改進,對本發(fā)明產(chǎn)品各原料的等效替換及輔助成分的添加、具體方式的選擇等,均落在本發(fā)明的保護范圍和公開范圍之內(nèi)。當(dāng)前第1頁1 2 3