亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

確定胚胎基因組中預(yù)定區(qū)域堿基信息的方法、系統(tǒng)和計(jì)算機(jī)可讀介質(zhì)與流程

文檔序號(hào):11965984閱讀:357來源:國(guó)知局
確定胚胎基因組中預(yù)定區(qū)域堿基信息的方法、系統(tǒng)和計(jì)算機(jī)可讀介質(zhì)與流程
確定胚胎基因組中預(yù)定區(qū)域堿基信息的方法、系統(tǒng)和計(jì)算機(jī)可讀介質(zhì)優(yōu)先權(quán)信息無技術(shù)領(lǐng)域本發(fā)明涉及確定胚胎基因組中預(yù)定區(qū)域堿基信息的方法、系統(tǒng)和計(jì)算機(jī)可讀介質(zhì)。

背景技術(shù):
遺傳性疾病是由于遺傳物質(zhì)發(fā)生改變而造成的疾病,具有先天性、家族性、終身性和遺傳性的特點(diǎn)。遺傳性疾病可分為3個(gè)大類:?jiǎn)位蜻z傳病、多基因遺傳病及染色體異常。其中單基因病多由于單個(gè)致病基因的顯性或隱性遺傳所致基因功能異常;而多基因遺傳病則是由多個(gè)基因變化影響所致的疾病,會(huì)在一定程度上受到外界環(huán)境因素的影響;染色體異常包括數(shù)目異常和結(jié)構(gòu)異常,最為多見的是由于第21號(hào)染色體三體所致的唐氏綜合癥,患兒表現(xiàn)為先天愚型和肢體形狀異常等其他先天性特征。由于目前對(duì)遺傳性疾病尚無有效的治療方式,只能針對(duì)性地進(jìn)行支持治療或者藥物緩解,費(fèi)用昂貴,給社會(huì)和家庭帶來沉重經(jīng)濟(jì)和精神負(fù)擔(dān)。因此,在孩子出生前就對(duì)孩子的患病狀態(tài)進(jìn)行檢測(cè),做好預(yù)防工作,以達(dá)到優(yōu)生優(yōu)育的目的,是十分必要的。例如在體外生殖過程中,在胚胎植入子宮之前,對(duì)胚胎的患病狀態(tài)進(jìn)行檢測(cè),將具有重大意義。對(duì)配子或植入到子宮腔之前的胚胎進(jìn)行遺傳學(xué)分析,將排除致病因素的正常胚胎植入子宮,從而防止患有遺傳病的孩子的妊娠。對(duì)具有高風(fēng)險(xiǎn)妊娠遺傳缺陷胚胎的夫婦實(shí)施植入前胚胎的患病狀態(tài)的檢測(cè),無疑能有效降低患病孩子的出生,并且避免選擇性終止妊娠給孕婦及家庭帶來的諸多危害。然而,目前的相關(guān)檢測(cè)手段仍有待改進(jìn)。

技術(shù)實(shí)現(xiàn)要素:
本發(fā)明是基于發(fā)明人的下列發(fā)現(xiàn)而完成的:發(fā)明人發(fā)現(xiàn),植入前胚胎中可以活檢取樣進(jìn)行檢測(cè)的細(xì)胞數(shù)有限。例如培養(yǎng)至第三天的卵裂球僅有4-8個(gè)細(xì)胞,可以進(jìn)行活檢取樣的僅1-2個(gè)細(xì)胞。即使在培養(yǎng)至第五天的囊胚,進(jìn)行外滋養(yǎng)層細(xì)胞活檢取樣也只能取到3-10個(gè)細(xì)胞。由于單個(gè)或少數(shù)胚胎細(xì)胞的DNA量有限,難以直接進(jìn)行全面的遺傳變異檢測(cè),必需經(jīng)過全基因組擴(kuò)增(WholeGenomeAmplification,WGA),達(dá)到足夠DNA量,才能對(duì)遺傳變異做全面分析。而全基因組擴(kuò)增常存在偏好性,會(huì)產(chǎn)生一定的雜合缺失或等位基因脫扣(AlleleDropOut)等現(xiàn)象,這些都為胚胎細(xì)胞的遺傳病相關(guān)的遺傳變異檢測(cè)帶來風(fēng)險(xiǎn)。因此,很有必要開發(fā)能夠?qū)U(kuò)增引起的等位基因脫扣等錯(cuò)誤進(jìn)行定位和矯正的方法,以提高遺傳變異檢測(cè)的準(zhǔn)確性。本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一。通過本發(fā)明方法推算胚胎單倍體型,可以對(duì)發(fā)生等位基因脫扣的位點(diǎn)進(jìn)行定位,并能夠進(jìn)行矯正。而胚胎單倍體型分析方法可以基于家系成員如父母和先證者的遺傳信息,或者基于來自同一父母的其他胚胎細(xì)胞的遺傳信息進(jìn)行推算。在本發(fā)明的一個(gè)方面,本發(fā)明提出了一種確定胚胎基因組中預(yù)定區(qū)域堿基信息的方法。該方法結(jié)合系譜推斷和統(tǒng)計(jì)算法來進(jìn)行胚胎單體型的確定,通過家系中相關(guān)個(gè)體的基因型,即追溯染色體片段的傳遞,結(jié)合統(tǒng)計(jì)算法來推斷單體型狀態(tài)。根據(jù)本發(fā)明的實(shí)施例,該方法包括下列步驟:獲得胚胎細(xì)胞基因組DNA樣本的測(cè)序結(jié)果,以及胚胎遺傳相關(guān)個(gè)體基因組樣本的測(cè)序結(jié)果;基于胚胎細(xì)胞基因組DNA樣本的測(cè)序結(jié)果,構(gòu)建所述胚胎的遺傳草圖,以便確定胚胎初始基因型;基于所述胚胎遺傳相關(guān)個(gè)體基因組樣本的測(cè)序結(jié)果,確定胚胎父母的單倍體型;以及根據(jù)隱馬爾可夫模型,以所述胚胎初始基因型作為觀察序列,基于所述胚胎父母的單倍體型,確定胚胎基因組中預(yù)定區(qū)域的堿基信息。需要說明的是,子代的基因組形成過程,相當(dāng)于親代基因組的一次隨機(jī)重組(即連鎖互換單倍體型重組,以及配子的隨機(jī)組合)。將胚胎的單倍型作為隱含狀態(tài)(hiddenstates),將胚胎單細(xì)胞全基因組擴(kuò)增后的測(cè)序數(shù)據(jù)作為觀察序列(observations),利用貝葉斯算法借助先驗(yàn)數(shù)據(jù)推算出狀態(tài)轉(zhuǎn)移概率(transitionprobabilities),構(gòu)建觀察序列概率分布(observationsymbolprobabilities)和初始狀態(tài)概率分布(initialstatedistribution),然后通過惠特比算法(Viterbialgorithm)可以推斷出最可能的胚胎單體型組合。因而,根據(jù)本發(fā)明的實(shí)施例,借助隱馬爾可夫模型,例如可以通過利用惠特比算法(Viterbialgorithm),參考胚胎遺傳相關(guān)個(gè)體的遺傳信息,可以確定胚胎基因組中特定區(qū)域的核酸序列,由此,可以有效地對(duì)胚胎基因組的遺傳信息進(jìn)行植入前檢測(cè)。對(duì)于在胚胎細(xì)胞全基因組擴(kuò)增DNA測(cè)序結(jié)果中覆蓋程度較低,存在雜合缺失或等位基因脫扣(AlleleDropOut)的位點(diǎn)或DNA序列,可以通過本方法準(zhǔn)確地推斷得到。因此通過本方法,可以對(duì)雜合缺失或等位基因脫扣(AlleleDropOut)的位點(diǎn)或序列進(jìn)行校正,使檢測(cè)結(jié)果更加準(zhǔn)確可靠。在本發(fā)明的又一方面,本發(fā)明提出了一種用于確定胚胎基因組中預(yù)定區(qū)域堿基信息的系統(tǒng)。根據(jù)本發(fā)明的實(shí)施例,該系統(tǒng)包括:文庫構(gòu)建裝置,所述文庫構(gòu)建裝置適于針對(duì)胚胎基因組DNA樣本以及胚胎遺傳相關(guān)個(gè)體的基因組DNA樣本,分別構(gòu)建測(cè)序文庫;測(cè)序裝置,所述測(cè)序裝置與所述文庫構(gòu)建裝置相連,并且適于對(duì)所述測(cè)序文庫進(jìn)行測(cè)序,以便獲得胚胎以及胚胎遺傳相關(guān)個(gè)體的測(cè)序結(jié)果;以及分析裝置,所述分析裝置與所述測(cè)序裝置相連,并且適于:基于胚胎基因組DNA樣本的測(cè)序結(jié)果,構(gòu)建所述胚胎的遺傳草圖,以便確定胚胎初始基因型;基于所述胚胎遺傳相關(guān)個(gè)體基因組樣本的測(cè)序結(jié)果,確定胚胎父母的單倍體型;以及根據(jù)隱馬爾可夫模型,以所述胚胎初始基因型作為觀察序列,基于所述胚胎父母的單倍體型,確定胚胎基因組中預(yù)定區(qū)域的堿基信息。根據(jù)本發(fā)明的實(shí)施例,還可以進(jìn)一步包括胚胎活檢裝置,所述胚胎活檢裝置適于針對(duì)體外培養(yǎng)的胚胎進(jìn)行活檢,對(duì)胚胎細(xì)胞進(jìn)行取樣。利用該系統(tǒng),能夠有效地實(shí)施前面所述的確定胚胎基因組中預(yù)定區(qū)域堿基信息的方法,可以借助隱馬爾可夫模型,例如可以通過利用惠特比算法(Viterbialgorithm),參考胚胎遺傳相關(guān)個(gè)體的遺傳信息,可以確定胚胎基因組中特定區(qū)域的核酸序列,由此,可以有效地對(duì)胚胎基因組的遺傳信息進(jìn)行植入前檢測(cè),從而可以有效地對(duì)胚胎基因組的遺傳信息進(jìn)行確定。在本發(fā)明的另一方面,本發(fā)明還提出了一種計(jì)算機(jī)可讀介質(zhì)。根據(jù)本發(fā)明的實(shí)施例,基于胚胎細(xì)胞基因組DNA樣本的測(cè)序結(jié)果,構(gòu)建胚胎的遺傳草圖,以便確定胚胎初始基因型;基于所述胚胎遺傳相關(guān)個(gè)體基因組樣本的測(cè)序結(jié)果,確定胚胎父母的單倍體型;以及以根據(jù)隱馬爾可夫模型,所述胚胎初始基因型作為觀察序列,基于所述胚胎父母的單倍體型,確定胚胎基因組中預(yù)定區(qū)域的堿基信息。利用本發(fā)明的計(jì)算機(jī)可讀介質(zhì),能夠有效地被處理器執(zhí)行其存儲(chǔ)的指令,以便借助隱馬爾可夫模型,例如可以通過利用惠特比算法(Viterbialgorithm),基于胚胎細(xì)胞的測(cè)序結(jié)果,參考胚胎遺傳相關(guān)個(gè)體的遺傳信息,可以確定胚胎基因組中特定區(qū)域的核酸序列,由此,可以有效地對(duì)胚胎基因組的遺傳信息進(jìn)行植入前檢測(cè)。本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。附圖說明本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:圖1為根據(jù)本發(fā)明一個(gè)實(shí)施例的利用隱馬爾可夫模型進(jìn)行分析的流程示意圖;以及圖2為根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于確定胚胎基因組中預(yù)定區(qū)域核酸序列的系統(tǒng)的結(jié)構(gòu)示意圖。發(fā)明詳細(xì)描述下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。需要說明的是,術(shù)語“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括一個(gè)或者更多個(gè)該特征。進(jìn)一步地,在本發(fā)明的描述中,除非另有說明,“多個(gè)”的含義是兩個(gè)或兩個(gè)以上。確定胚胎基因組中預(yù)定區(qū)域堿基信息的方法在本發(fā)明的第一方面,本發(fā)明提出了一種確定胚胎基因組中預(yù)定區(qū)域堿基信息的方法。根據(jù)本發(fā)明的實(shí)施例,該方法包括下列步驟:首先,獲得胚胎細(xì)胞基因組DNA樣本的測(cè)序結(jié)果,以及胚胎遺傳相關(guān)個(gè)體基因組樣本的測(cè)序結(jié)果。其中,在本文中所使用的術(shù)語“胚胎遺傳相關(guān)個(gè)體”指的是在遺傳意義上,與胚胎之間具有親緣關(guān)系的個(gè)體,例如根據(jù)本發(fā)明的實(shí)施例,可以采用的“胚胎遺傳相關(guān)個(gè)體”為胚胎的親代例如父母、祖父母、外祖父母以及胚胎父母的其他子女。這里所說的胚胎父母的其他子女應(yīng)做廣義理解,既可以是已經(jīng)出生的子女,也可以是尚未出生的子女(受精卵或胚胎),也可以是死亡的胚胎,也可以是體外培養(yǎng)的胚胎或受精卵,只要與待檢測(cè)胚胎共有相同的父母即可。根據(jù)本發(fā)明的實(shí)施例,胚胎細(xì)胞基因組DNA樣本的來源并不受特別限制。根據(jù)本發(fā)明的實(shí)施例,具體地,可以針對(duì)胚胎進(jìn)行活檢取樣,獲得胚胎細(xì)胞,并對(duì)胚胎細(xì)胞樣本進(jìn)行全基因組擴(kuò)增(WGA),以便獲得胚胎細(xì)胞基因組DNA。在本文中所采用的術(shù)語“胚胎活檢”是指利用顯微技術(shù),從胚胎中分離部分胚胎細(xì)胞,或從受精卵/配子中分離部分細(xì)胞的技術(shù)。其中,根據(jù)本發(fā)明的實(shí)施例,該胚胎細(xì)胞可來自于卵裂球、囊胚滋養(yǎng)層、受精卵和配子中的任一種,可以是單個(gè)細(xì)胞,也可以是2-10個(gè)細(xì)胞。此外,也可以采用任何含有胚胎核酸的孕婦樣本進(jìn)行全基因組擴(kuò)增,以便獲得胚胎基因組DNA樣本。由此,可以在不影響胚胎正常發(fā)育的前提下,對(duì)胚胎的基因組進(jìn)行有效監(jiān)測(cè)。其中,“全基因組擴(kuò)增(WGA)”主要包括多重鏈置換擴(kuò)增(MultipleDisplacementAmplification,MDA)和基于PCR的WGA技術(shù),可以采用自主開發(fā)的WGA擴(kuò)增流程,也可以采用商業(yè)化的試劑盒如Qiagen公司的REPLI-g系列的試劑盒、Sigma-Aldrich公司的GenomePlexWGA試劑盒(WGA4)、RubiconGenomics公司的PicoPlexWGA試劑盒、GE-Healthcare公司的illustraGenomiphiWGA試劑盒等。在擴(kuò)增DNA樣本之后,針對(duì)胚胎細(xì)胞的擴(kuò)增DNA樣本以及胚胎遺傳相關(guān)個(gè)體的基因組DNA樣本,分別構(gòu)建測(cè)序文庫。關(guān)于針對(duì)核酸樣本,構(gòu)建測(cè)序文庫的方法和流程,本領(lǐng)域技術(shù)人員可以根據(jù)不同的測(cè)序技術(shù)進(jìn)行適當(dāng)選擇,關(guān)于流程的細(xì)節(jié),可以參見測(cè)序儀器的廠商例如Illumina公司所提供的規(guī)程,例如參見Illumina公司MultiplexingSamplePreparationGuide(Part#1005361;Feb2010)或Paired-EndSamplePrepGuide(Part#1005063;Feb2010),通過參照將其并入本文。根據(jù)本發(fā)明的實(shí)施例,從生物樣本提取核酸樣本的方法和設(shè)備,也不受特別限制,可以采用商品化的核酸提取試劑盒進(jìn)行。在構(gòu)建測(cè)序文庫后,將測(cè)序文庫應(yīng)用于測(cè)序儀器,對(duì)測(cè)序文庫進(jìn)行測(cè)序,并獲得相應(yīng)的測(cè)序結(jié)果,該測(cè)序結(jié)果是由多個(gè)測(cè)序數(shù)據(jù)構(gòu)成的。根據(jù)本發(fā)明的實(shí)施例,可以用于進(jìn)行測(cè)序的方法和設(shè)備并不受特別限制,包括但不限于雙脫氧鏈終止法;優(yōu)選高通量的測(cè)序方法,由此,能夠利用這些測(cè)序裝置的高通量、深度測(cè)序的特點(diǎn),進(jìn)一步提高測(cè)序效率。從而,能夠提高后續(xù)對(duì)測(cè)序數(shù)據(jù)進(jìn)行分析,尤其是統(tǒng)計(jì)檢驗(yàn)分析時(shí)的精確性和準(zhǔn)確度。所述高通量的測(cè)序方法包括但不限于第二代測(cè)序技術(shù)或者是單分子測(cè)序技術(shù)。所述第二代測(cè)序平臺(tái)(MetzkerML.Sequencingtechnologies-thenextgeneration.NatRevGenet.2010Jan;11(1):31-46)包括但不限于Illumina-Solexa(GATM,HiSeq2000TM,Miseq等)、ABI-SOLiD、LifeTechnologies-IonTorrent/Proton和Roche-454(焦磷酸測(cè)序)測(cè)序平臺(tái);單分子測(cè)序平臺(tái)(技術(shù))包括但不限于Helicos公司的真實(shí)單分子測(cè)序技術(shù)(TrueSingleMoleculeDNAsequencing),PacificBiosciences公司單分子實(shí)時(shí)測(cè)序(singlemoleculereal-time(SMRTTM)),以及OxfordNanoporeTechnologies公司的納米孔測(cè)序技術(shù)等(Rusk,Nicole(2009-04-01).CheapThird-GenerationSequencing.NatureMethods6(4):244-245)。隨著測(cè)序技術(shù)的不斷進(jìn)化,本領(lǐng)域技術(shù)人員能夠理解的是還可以采用其他的測(cè)序方法和裝置進(jìn)行全基因組測(cè)序。根據(jù)本發(fā)明的具體示例,可以利用選自Illumina-Solexa、ABI-SOLiD、LifeTechnologies-IonTorrent/Proton、Roche-454和單分子測(cè)序裝置的至少一種對(duì)所述全基因組測(cè)序文庫進(jìn)行測(cè)序。根據(jù)本發(fā)明的實(shí)施例,在得到測(cè)序結(jié)果之后,可以基于胚胎細(xì)胞基因組DNA樣本的測(cè)序結(jié)果,構(gòu)建所述胚胎的遺傳草圖,以便確定胚胎初始基因型?;谒雠咛ミz傳相關(guān)個(gè)體基因組樣本的測(cè)序結(jié)果,確定胚胎父母的單倍體型。根據(jù)本發(fā)明的實(shí)施例,通過將胚胎細(xì)胞基因組DNA樣本的測(cè)序結(jié)果與參考序列進(jìn)行比對(duì),構(gòu)建所述胚胎的遺傳草圖。通過將所述胚胎遺傳相關(guān)個(gè)體基因組樣本的測(cè)序結(jié)果與參考序列進(jìn)行比對(duì),確定所述胚胎遺傳相關(guān)個(gè)體的基因型;以及基于所述胚胎遺傳相關(guān)個(gè)體的基因型,確定所述胚胎父母的單倍體型。根據(jù)本發(fā)明的實(shí)施例,可以采用已知的人類參考基因組作為參考序列。例如,根據(jù)本發(fā)明的實(shí)施例,采用的人類參考基因組為NCBI36.3,HG18。另外,根據(jù)本發(fā)明的實(shí)施例,進(jìn)行比對(duì)的方法并不受特別限制。根據(jù)本發(fā)明的具體實(shí)施例,可以采用SOAP進(jìn)行比對(duì)。最后,以所述胚胎初始基因型作為觀察序列,基于所述胚胎父母的單倍體型,根據(jù)隱馬爾可夫模型,確定胚胎基因組中預(yù)定區(qū)域的堿基信息。在本文中所使用的術(shù)語“預(yù)定區(qū)域”應(yīng)作廣義理解,是指任何包含可能發(fā)生預(yù)定事件位點(diǎn)的核酸分子的區(qū)域。對(duì)于SNP分析而言,可以是指包含SNP位點(diǎn)的區(qū)域。對(duì)于分析染色體非整倍性,則預(yù)定區(qū)域指的是所要分析的染色體的全長(zhǎng)或者部分,即選擇所有來自該染色體的測(cè)序數(shù)據(jù)。從測(cè)序結(jié)果中選擇來自相應(yīng)區(qū)域的測(cè)序數(shù)據(jù)的方法可以不受特別限制。根據(jù)本發(fā)明的實(shí)施例,可以通過將所得到的所有測(cè)序數(shù)據(jù)與已知的核酸參考序列進(jìn)行比對(duì),從而得到來自于預(yù)定區(qū)域的測(cè)序數(shù)據(jù)。另外,根據(jù)本發(fā)明的實(shí)施例,預(yù)定區(qū)域也可以是基因組上不連續(xù)的多個(gè)分散點(diǎn)。根據(jù)本發(fā)明的實(shí)施例,可以使用的參考序列的類型并不受特別限制,可以為任何含有感興趣區(qū)域的已知序列。根據(jù)本發(fā)明的實(shí)施例,可以通過基于所述胚胎細(xì)胞的測(cè)序結(jié)果,結(jié)合胚胎遺傳相關(guān)個(gè)體的遺傳信息,根據(jù)隱馬爾可夫模型,確定所述預(yù)定區(qū)域的堿基信息。根據(jù)本發(fā)明的實(shí)施例,可以借助隱馬爾可夫模型,利用惠特比算法(Viterbialgorithm),確定胚胎基因組中特定區(qū)域的堿基信息。由此,可以有效地對(duì)胚胎基因組的遺傳信息進(jìn)行植入前檢測(cè)。下面參考圖1,對(duì)借助隱馬爾可夫模型利用惠特比算法進(jìn)行分析的原理進(jìn)行詳細(xì)描述:如前所述,在本文中所使用的術(shù)語“胚胎遺傳相關(guān)個(gè)體”指的是在遺傳意義上,與胚胎之間具有親緣關(guān)系的個(gè)體,例如根據(jù)本發(fā)明的實(shí)施例,可以采用的“胚胎遺傳相關(guān)個(gè)體”為胚胎的親代例如父母、祖父母、外祖父母以及胚胎父母的其他子女。這里所說的胚胎父母的其他子女應(yīng)做廣義理解,既可以是已經(jīng)出生的子女,也可以是尚未出生的子女(胚胎或受精卵),也可以是死亡的胚胎,也可以是體外培養(yǎng)的胚胎或受精卵,只要與待檢測(cè)胚胎共有相同的父母即可。由此,子代的基因組形成過程,相當(dāng)于親代基因組的一次隨機(jī)重組(即連鎖互換單倍體型重組,以及配子的隨機(jī)組合)。將胚胎的單倍型作為隱含狀態(tài)(hiddenstates),將胚胎單細(xì)胞全基因組擴(kuò)增后的測(cè)序數(shù)據(jù)作為觀察序列(observations),借助先驗(yàn)數(shù)據(jù)推算出狀態(tài)轉(zhuǎn)移概率(transitionprobabilities),構(gòu)建確定觀察序列概率分布(observationsymbolprobabilities)和初始狀態(tài)概率分布(initialstatedistribution),然后通過惠特比算法(Viterbialgorithm)可以推斷出最可能的胚胎單體型組合。因而,根據(jù)本發(fā)明的實(shí)施例,借助隱馬爾可夫模型,例如可以通過利用惠特比算法(Viterbialgorithm),參考胚胎遺傳相關(guān)個(gè)體的遺傳信息,可以確定胚胎基因組中特定區(qū)域的核酸序列,由此,可以有效地對(duì)胚胎基因組的遺傳信息進(jìn)行植入前檢測(cè)。詳細(xì)分析步驟如下:標(biāo)記:I.需要檢測(cè)的位點(diǎn)數(shù)為N。II.觀測(cè)序列;III.隱藏狀態(tài)集為:S={0,1},定義了父母哪條染色體遺傳給了子代。0代表遺傳給了先證者的那條染色體,1代表沒有遺傳給先證者的那條染色體。IV.觀測(cè)狀態(tài)集為:V={0,1},1代表遺傳給先證者的染色體與胚胎遺傳草圖基因型一致,0代表不一致。第一步,構(gòu)建初始狀態(tài)概率分布向量,單倍體重組轉(zhuǎn)移矩陣以及觀察序列概率矩陣I.初始狀態(tài)概率分布記為π={πi},(i∈S,πi=0.5),在沒有參考數(shù)據(jù)的情況下,可以假設(shè)每種隱藏狀態(tài)出現(xiàn)的可能性相等。II.記單倍體重組轉(zhuǎn)移矩陣記為A={aij},(i,j∈S),即隱藏狀態(tài)轉(zhuǎn)移的概率。Nr、Np分別表示期望重組數(shù)和單核苷酸多態(tài)性位點(diǎn)數(shù),根據(jù)先驗(yàn)數(shù)據(jù)Nr可取20-40之間的自然數(shù),用來計(jì)算隱藏狀態(tài)的轉(zhuǎn)移概率,即計(jì)算每個(gè)堿基組合的單體型發(fā)生重組的概率。III.記觀察序列概率矩陣為B={bi(k)},(i∈S,k∈V),這里的概率分布bi(k)用子代一定是純合(Must-hom)或一定是雜合(Must-het)的位點(diǎn)來估算。第二步,構(gòu)建局部概率矩陣和逆向指針定義局部概率:δt(j)=max[δt-1(i)·aij]·bj(K)t∈{1...N}。定義逆向指針:Ψi(j)=argmaxδt-1(i)·aijt∈{1...N}。第三步,確定最終狀態(tài)狀態(tài),并回溯最優(yōu)路徑確定最終狀態(tài),回溯最優(yōu)路徑,即最可能胚胎單基因型qt*=Ψt+1(q*t+1)(t=1,2,3,...,N-1)。第四步,輸出結(jié)果即,根據(jù)本發(fā)明的實(shí)施例,根據(jù)隱馬爾可夫模型,確定胚胎基因組中預(yù)定區(qū)域的堿基信息進(jìn)一步包括:構(gòu)建初始狀態(tài)概率分布向量、隱藏狀態(tài)轉(zhuǎn)移的概率矩陣以及觀察序列概率矩陣;利用惠特比算法確定最終狀態(tài)并回溯最優(yōu)路徑,以便確定胚胎基因組中預(yù)定區(qū)域的堿基信息。根據(jù)具體的實(shí)施例,所述隱馬爾可夫模型采用下列參數(shù):初始狀態(tài)概率分布為π={πi},(i∈S,πi=0.5),隱藏狀態(tài)轉(zhuǎn)移的概率矩陣為A={aij},(i,j∈S),其中,Nr、Np分別表示期望重組數(shù)和單核苷酸多態(tài)性位點(diǎn)數(shù),Nr為自然數(shù),取值范圍20-40,觀察序列概率矩陣為B={bi(k)},(i∈S,k∈V),其中,#sites(L>0,Must-hom.)為子代一定為純合的位點(diǎn)的數(shù)目,#sites(L>0,Must-hom.orMust-het.)為子代一定為純合的位點(diǎn)的數(shù)目以及子代一定為雜合的位點(diǎn)的數(shù)目的總和;局部概率為δt(j)=max[δt-1(i)·aij]·bj(K)t∈{1...N},逆向指針為Ψi(j)=argmaxδt-1(i)·aijt∈{1...N},依惠特比算法經(jīng)遞歸得最終狀態(tài)為回溯最優(yōu)路徑,確定最可能的胚胎預(yù)定區(qū)域的堿基信息為qt*=Ψt+1(q*t+1)(t=1,2,3,...,N-1)。其中,這里所使用的術(shù)語“局部概率δi(qi)”和“逆向指針Ψi(qi)”都是沿用Viterbi算法的經(jīng)典定義。關(guān)于該參數(shù)的定義的詳細(xì)描述,可以參見LawrenceR.Rabiner,PROCEEDINGSOFTHEIEEE,Vol.77,No.2,1989年2月,通過參照將其全文并入本文。由此,能夠有效地對(duì)胚胎基因組的序列進(jìn)行分析。相比其他已有的植入前檢測(cè)技術(shù)方法,本方法有以下技術(shù)優(yōu)勢(shì),主要體現(xiàn)在準(zhǔn)確性和可獲得的遺傳信息量上:1)根據(jù)本發(fā)明實(shí)施例,針對(duì)胚胎的父源性位點(diǎn)和母源性位點(diǎn),均可以很好地檢測(cè),檢測(cè)準(zhǔn)確率可高達(dá)95%以上,且可以檢測(cè)多種變異類型,擴(kuò)大了疾病檢測(cè)的范圍。2)根據(jù)本發(fā)明實(shí)施例,對(duì)于一些在胚胎單細(xì)胞或微量細(xì)胞全基因組擴(kuò)增DNA測(cè)序結(jié)果中覆蓋程度較低,存在雜合缺失或等位基因脫扣(AlleleDropOut)的位點(diǎn)或DNA序列,可以通過本方法準(zhǔn)確地推斷得到。因此通過本方法,可以對(duì)雜合缺失或等位基因脫扣(AlleleDropOut)的位點(diǎn)或序列進(jìn)行校正,使檢測(cè)結(jié)果更加準(zhǔn)確可靠。3)根據(jù)本發(fā)明實(shí)施例,可進(jìn)行遺傳疾病作圖,對(duì)于一些連鎖相關(guān)疾病,可通過其他位點(diǎn)的信息直接推斷出來,一次可獲得的信息量大,對(duì)臨床檢測(cè)更加具有指導(dǎo)意義。另外,根據(jù)本發(fā)明實(shí)施例,本發(fā)明的確定胚胎基因組中預(yù)定區(qū)域堿基信息的方法,不僅限于SNP或者STR等某一種遺傳多態(tài)性位點(diǎn),對(duì)所有的遺傳多態(tài)性位點(diǎn)均可適用,且可以多種位點(diǎn)同時(shí)使用,以便互相驗(yàn)證。用于確定胚胎基因組中預(yù)定區(qū)域堿基信息的系統(tǒng)在本發(fā)明的又一方面,本發(fā)明提出了一種用于確定胚胎基因組中預(yù)定區(qū)域核酸序列的系統(tǒng)。根據(jù)本發(fā)明的實(shí)施例,參考圖2,該系統(tǒng)1000可以包括:文庫構(gòu)建裝置100、測(cè)序裝置200以及分析裝置400。根據(jù)本發(fā)明的實(shí)施例,文庫構(gòu)建裝置100適于針對(duì)胚胎基因組DNA樣本以及胚胎遺傳相關(guān)個(gè)體的基因組DNA樣本,分別構(gòu)建測(cè)序文庫。根據(jù)本發(fā)明的實(shí)施例,測(cè)序裝置200與文庫構(gòu)建裝置100相連,并且適于對(duì)所述測(cè)序文庫進(jìn)行測(cè)序,以便獲得胚胎以及胚胎遺傳相關(guān)個(gè)體的測(cè)序結(jié)果。根據(jù)本發(fā)明的實(shí)施例,還可以進(jìn)一步包括DNA樣本分離裝置和DNA擴(kuò)增裝置(圖中未示出),該DNA樣本分離裝置適于針對(duì)胚胎進(jìn)行活檢取樣,獲得胚胎細(xì)胞。胚胎細(xì)胞可來自于卵裂球、囊胚滋養(yǎng)層、受精卵和配子中的任一種,可以是單個(gè)細(xì)胞,也可以是微量細(xì)胞例如2-10個(gè)細(xì)胞,也可以采用任何含有胚胎核酸的孕婦樣本。該DNA擴(kuò)增裝置適于針對(duì)活檢取樣獲得的胚胎細(xì)胞進(jìn)行全基因組擴(kuò)增,以獲得足夠量DNA用于后續(xù)檢測(cè)分析。由此,可以在不影響胚胎正常發(fā)育的前提下,對(duì)胚胎的基因組進(jìn)行有效監(jiān)測(cè)。關(guān)于全基因組擴(kuò)增的方法和流程,主要包括多重鏈置換擴(kuò)增(MultipleDisplacementAmplification,MDA)和基于PCR的WGA技術(shù),可以采用自主開發(fā)的WGA擴(kuò)增流程,也可以采用商業(yè)化的試劑盒如Qiagen公司的REPLI-g系列的試劑盒、Sigma-Aldrich公司的GenomePlexWGA試劑盒(WGA4)、RubiconGenomics公司的PicoPlexWGA試劑盒、GE-Healthcare公司的illustraGenomiphiWGA試劑盒等等。關(guān)于針對(duì)核酸樣本,構(gòu)建測(cè)序文庫的方法和流程,本領(lǐng)域技術(shù)人員可以根據(jù)不同的測(cè)序技術(shù)進(jìn)行適當(dāng)選擇,關(guān)于流程的細(xì)節(jié),可以參見測(cè)序儀器的廠商例如Illumina公司所提供的規(guī)程,例如參見Illumina公司MultiplexingSamplePreparationGuide(Part#1005361;Feb2010)或Paired-EndSamplePrepGuide(Part#1005063;Feb2010),通過參照將其并入本文。根據(jù)本發(fā)明的實(shí)施例,從生物樣本提取核酸樣本的方法和設(shè)備,也不受特別限制,可以采用商品化的核酸提取試劑盒進(jìn)行。根據(jù)本發(fā)明的實(shí)施例,可以用于進(jìn)行測(cè)序的方法和設(shè)備并不受特別限制,包括但不限于雙脫氧鏈終止法;優(yōu)選高通量的測(cè)序方法,由此,能夠利用這些測(cè)序裝置的高通量、深度測(cè)序的特點(diǎn),進(jìn)一步提高測(cè)序效率。從而,能夠提高后續(xù)對(duì)測(cè)序數(shù)據(jù)進(jìn)行分析,尤其是統(tǒng)計(jì)檢驗(yàn)分析時(shí)的精確性和準(zhǔn)確度。所述高通量的測(cè)序方法包括但不限于第二代測(cè)序技術(shù)或者是單分子測(cè)序技術(shù)。所述第二代測(cè)序平臺(tái)(MetzkerML.Sequencingtechnologies-thenextgeneration.NatRevGenet.2010Jan;11(1):31-46)包括但不限于Illumina-Solexa(GATM、HiSeqTM、Miseq等)、ABI-SOLiD、LifeTechnologies-IonTorrent/Proton和Roche-454(焦磷酸測(cè)序)測(cè)序平臺(tái);單分子測(cè)序平臺(tái)(技術(shù))包括但不限于Helicos公司的真實(shí)單分子測(cè)序技術(shù)(TrueSingleMoleculeDNAsequencing),PacificBiosciences公司單分子實(shí)時(shí)測(cè)序(singlemoleculereal-time(SMRTTM)),以及OxfordNanoporeTechnologies公司的納米孔測(cè)序技術(shù)等(Rusk,Nicole(2009-04-01).CheapThird-GenerationSequencing.NatureMethods6(4):244-245)。隨著測(cè)序技術(shù)的不斷進(jìn)化,本領(lǐng)域技術(shù)人員能夠理解的是還可以采用其他的測(cè)序方法和裝置進(jìn)行全基因組測(cè)序。根據(jù)本發(fā)明的具體示例,可以利用選自Illumina-Solexa、ABI-SOLiD、LifeTechnologies-IonTorrent/Proton、Roche-454和單分子測(cè)序裝置的至少一種對(duì)所述全基因組測(cè)序文庫進(jìn)行測(cè)序。根據(jù)本發(fā)明的實(shí)施例,還可以包括比對(duì)裝置300。根據(jù)本發(fā)明的實(shí)施例,比對(duì)裝置300與測(cè)序裝置200相連,并且適于將所得到的測(cè)序結(jié)果與參考序列進(jìn)行比對(duì),以便通過將胚胎細(xì)胞基因組DNA樣本的測(cè)序結(jié)果與參考序列進(jìn)行比對(duì),構(gòu)建所述胚胎的遺傳草圖;通過將所述胚胎遺傳相關(guān)個(gè)體基因組樣本的測(cè)序結(jié)果與參考序列進(jìn)行比對(duì),確定所述胚胎遺傳相關(guān)個(gè)體的基因型;以及基于所述胚胎遺傳相關(guān)個(gè)體的基因型,確定所述胚胎父母的單倍體型。根據(jù)本發(fā)明的實(shí)施例,可以使用的參考序列的類型并不受特別限制,可以為任何含有感興趣區(qū)域的已知序列。根據(jù)本發(fā)明的實(shí)施例,可以采用已知的人類參考基因組作為參考序列。例如,根據(jù)本發(fā)明的實(shí)施例,采用的人類參考基因組為NCBI36.3,HG18。另外,根據(jù)本發(fā)明的實(shí)施例,進(jìn)行比對(duì)的方法并不受特別限制。根據(jù)本發(fā)明的具體實(shí)施例,可以采用SOAP進(jìn)行比對(duì)。根據(jù)本發(fā)明的實(shí)施例,分析裝置400適于:基于胚胎細(xì)胞基因組DNA樣本的測(cè)序結(jié)果,構(gòu)建所述胚胎的遺傳草圖,以便確定胚胎初始基因型;基于所述胚胎遺傳相關(guān)個(gè)體基因組樣本的測(cè)序結(jié)果,確定胚胎父母的單倍體型;以及根據(jù)隱馬爾可夫模型,以所述胚胎初始基因型作為觀察序列,基于所述胚胎父母的單倍體型,確定胚胎基因組中預(yù)定區(qū)域的堿基信息。根據(jù)本發(fā)明的實(shí)施例,根據(jù)隱馬爾可夫模型,確定胚胎基因組中預(yù)定區(qū)域的堿基信息進(jìn)一步包括:構(gòu)建初始狀態(tài)概率分布向量、隱藏狀態(tài)轉(zhuǎn)移的概率矩陣以及觀察序列概率矩陣;利用惠特比算法確定最終狀態(tài)并回溯最優(yōu)路徑,以便確定胚胎基因組中預(yù)定區(qū)域的堿基信息。根據(jù)具體的實(shí)施例,所述隱馬爾可夫模型采用下列參數(shù):初始狀態(tài)概率分布為π={πi},(i∈S,πi=0.5),隱藏狀態(tài)轉(zhuǎn)移的概率矩陣為A={aij},(i,j∈S),其中,Nr,Np分別表示期望重組數(shù)和單核苷酸多態(tài)性位點(diǎn)數(shù),Nr可取20-40之間的自然數(shù),觀察序列概率矩陣為B={bi(k)},(i∈S,k∈V),其中,#sites(L>0,Must-hom.)為子代一定為純合的位點(diǎn)的數(shù)目,#sites(L>0,Must-hom.orMust-het.)為子代一定為純合的位點(diǎn)的數(shù)目以及子代一定為雜合的位點(diǎn)的數(shù)目的總和;局部概率為δt(j)=max[δt-1(i)·aij]·bj(K)t∈{1...N},逆向指針為Ψi(j)=argmaxδt-1(i)·aijt∈{1...N},遞歸得最終狀態(tài)為回溯最優(yōu)路徑,確定最可能的胚胎預(yù)定區(qū)域的堿基信息為qt*=Ψt+1(q*t+1)(t=1,2,3,...,N-1)。這里所使用的術(shù)語局部概率δi(qi)和逆向指針Ψi(qi)都是沿用Viterbi算法的經(jīng)典定義。關(guān)于該參數(shù)的定義的詳細(xì)描述,可以參見LawrenceR.Rabiner,PROCEEDINGSOFTHEIEEE,Vol.77,No.2,1989年2月,通過參照將其全文并入本文。關(guān)于數(shù)據(jù)分析部分,前面已經(jīng)進(jìn)行了詳細(xì)描述,也當(dāng)然地適用于確定胚胎基因組中預(yù)定區(qū)域核酸序列的系統(tǒng)。不再贅述。由此,利用該系統(tǒng),能夠有效地實(shí)施前面所述的確定胚胎基因組中預(yù)定區(qū)域核酸序列的方法,可以借助隱馬爾可夫模型,通過例如惠特比算法(Viterbialgorithm)解碼,確定胚胎基因組中特定區(qū)域的堿基信息,由此,可以有效地對(duì)胚胎基因組的遺傳信息進(jìn)行植入前檢測(cè)。此外,根據(jù)本發(fā)明的實(shí)施例,預(yù)定區(qū)域?yàn)橐阎嬖谶z傳多態(tài)性的位點(diǎn),而遺傳多態(tài)性為選自單核苷酸多態(tài)性和STR的至少一種。在本文中所述的術(shù)語“相連”應(yīng)作廣義理解,既可以是直接相連,也可以是間接相連,只要能夠?qū)崿F(xiàn)上述功能上的銜接即可。需要說明的是,本領(lǐng)域技術(shù)人員能夠理解,在前面所描述的確定胚胎基因組中預(yù)定區(qū)域核酸序列的方法的特征和優(yōu)點(diǎn)也適合于確定胚胎基因組中預(yù)定區(qū)域核酸序列的系統(tǒng),為描述方便,不再詳述。計(jì)算機(jī)可讀介質(zhì)在本發(fā)明的又一方面,本發(fā)明提出了一種計(jì)算機(jī)可讀介質(zhì)。根據(jù)本發(fā)明的實(shí)施例,所述計(jì)算機(jī)可讀介質(zhì)上存儲(chǔ)有指令,所述指令適于被處理器執(zhí)行以便:基于胚胎細(xì)胞基因組DNA樣本的測(cè)序結(jié)果,構(gòu)建胚胎的遺傳草圖,以便確定胚胎初始基因型;基于該胚胎遺傳相關(guān)個(gè)體基因組樣本的測(cè)序結(jié)果,確定胚胎父母的單倍體型;以及根據(jù)隱馬爾可夫模型,以該胚胎初始基因型作為觀察序列,基于該胚胎父母的單倍體型,確定胚胎基因組中預(yù)定區(qū)域的堿基信息。由此,利用該計(jì)算機(jī)可讀介質(zhì),能夠有效地實(shí)施前面所述的方法,從而可以通過例如惠特比算法(Viterbialgorithm),借助隱馬爾可夫模型,確定胚胎基因組中特定區(qū)域的堿基信息,由此,可以有效地對(duì)胚胎基因組的遺傳信息進(jìn)行植入前檢測(cè)。根據(jù)本發(fā)明的實(shí)施例,根據(jù)隱馬爾可夫模型,確定胚胎基因組中預(yù)定區(qū)域的堿基信息進(jìn)一步包括:構(gòu)建初始狀態(tài)概率分布向量、隱藏狀態(tài)轉(zhuǎn)移的概率矩陣以及觀察序列概率矩陣;利用惠特比算法確定最終狀態(tài)并回溯最優(yōu)路徑,以便確定胚胎基因組中預(yù)定區(qū)域的堿基信息。根據(jù)具體的實(shí)施例,所述隱馬爾可夫模型采用下列參數(shù):初始狀態(tài)概率分布為π={πi},(i∈S,πi=0.5),隱藏狀態(tài)轉(zhuǎn)移的概率矩陣為A={aij},(i,j∈S),其中,Nr、Np分別表示期望重組數(shù)和單核苷酸多態(tài)性位點(diǎn)數(shù),Nr可取20-40之間的自然數(shù),觀察序列概率矩陣為B={bi(k)},(i∈S,k∈V),其中,#sites(L>0,Must-hom.)為子代一定為純合的位點(diǎn)的數(shù)目,#sites(L>0,Must-hom.orMust-het.)為子代一定為純合的位點(diǎn)的數(shù)目以及子代一定為雜合的位點(diǎn)的數(shù)目的總和;局部概率為δt(j)=max[δt-1(i)·aij]·bj(K)t∈{1...N}逆向指針為Ψi(j)=argmaxδt-1(i)·aijt∈{1...N},經(jīng)遞歸得最終狀態(tài)為回溯最優(yōu)路徑,確定最可能的胚胎預(yù)定區(qū)域的堿基信息為qt*=Ψt+1(q*t+1)(t=1,2,3,...,N-1)。這里所使用的術(shù)語局部概率δi(qi)和逆向指針Ψi(qi)都是沿用Viterbi算法的經(jīng)典定義。關(guān)于該參數(shù)的定義的詳細(xì)描述,可以參見LawrenceR.Rabiner,PROCEEDINGSOFTHEIEEE,Vol.77,No.2,1989年2月,通過參照將其全文并入本文。關(guān)于數(shù)據(jù)分析部分,前面已經(jīng)進(jìn)行了詳細(xì)描述,也當(dāng)然地適用于確定胚胎基因組中預(yù)定區(qū)域核酸序列的系統(tǒng)。不再贅述。由此,利用該系統(tǒng),能夠有效地實(shí)施前面所述的確定胚胎基因組中預(yù)定區(qū)域核酸序列的方法,可以通過例如惠特比算法(Viterbialgorithm),借助隱馬爾可夫模型,確定胚胎基因組中特定區(qū)域的堿基信息,由此,可以有效地對(duì)胚胎基因組的遺傳信息進(jìn)行植入前檢測(cè)。此外,根據(jù)本發(fā)明的實(shí)施例,預(yù)定區(qū)域?yàn)橐阎嬖谶z傳多態(tài)性的位點(diǎn),而遺傳多態(tài)性為選自單核苷酸多態(tài)性和STR的至少一種。就本說明書而言,“計(jì)算機(jī)可讀介質(zhì)”可以是任何可以包含、存儲(chǔ)、通信、傳播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用的裝置。計(jì)算機(jī)可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下:具有一個(gè)或多個(gè)布線的電連接部(電子裝置),便攜式計(jì)算機(jī)盤盒(磁裝置),隨機(jī)存取存儲(chǔ)器(RAM),只讀存儲(chǔ)器(ROM),可擦除可編輯只讀存儲(chǔ)器(EPROM或閃速存儲(chǔ)器),光纖裝置,以及便攜式光盤只讀存儲(chǔ)器(CDROM)。另外,計(jì)算機(jī)可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其他合適的介質(zhì),因?yàn)槔缈梢酝ㄟ^對(duì)紙或其他介質(zhì)進(jìn)行光學(xué)掃描,接著進(jìn)行編輯、解譯或必要時(shí)以其他合適方式進(jìn)行處理來以電子方式獲得所述程序,然后將其存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)器中。應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。例如,如果用硬件來實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場(chǎng)可編程門陣列(FPGA)等。本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。此外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。下面將結(jié)合實(shí)施例對(duì)本發(fā)明的方案進(jìn)行解釋。本領(lǐng)域技術(shù)人員將會(huì)理解,下面的實(shí)施例僅用于說明本發(fā)明,而不應(yīng)視為限定本發(fā)明的范圍。實(shí)施例中未注明具體技術(shù)或條件的,按照本領(lǐng)域內(nèi)的文獻(xiàn)所描述的技術(shù)或條件(例如參考J.薩姆布魯克等著,黃培堂等譯的《分子克隆實(shí)驗(yàn)指南》,第三版,科學(xué)出版社)或者按照產(chǎn)品說明書進(jìn)行。所用試劑或儀器未注明生產(chǎn)廠商者,均為可以通過市購(gòu)獲得的常規(guī)產(chǎn)品,例如可以采購(gòu)自Illumina公司。一般方法:參考圖1,本發(fā)明實(shí)施例的主要步驟包括:1)獲得單細(xì)胞或微量細(xì)胞樣本,第三天卵裂球細(xì)胞或第五天囊胚滋養(yǎng)層細(xì)胞活檢取樣,或受精卵取樣,或其他單細(xì)胞或微量細(xì)胞取樣。2)單細(xì)胞或微量細(xì)胞樣本進(jìn)行全基因組擴(kuò)增,擴(kuò)增產(chǎn)物DNA根據(jù)新一代測(cè)序平臺(tái)要求構(gòu)建文庫,并進(jìn)行測(cè)序。3)單細(xì)胞或微量細(xì)胞測(cè)序數(shù)據(jù)經(jīng)過過濾后與人類基因組參考序列進(jìn)行比對(duì)。4)根據(jù)比對(duì)結(jié)果進(jìn)行胚胎細(xì)胞單核苷酸多態(tài)性和缺失重復(fù)等遺傳變異的初步檢測(cè)。5)構(gòu)建胚胎基因組的遺傳草圖,對(duì)胚胎基因型進(jìn)行初始化。6)收集胚胎遺傳相關(guān)個(gè)體,如家系成員如父母和先證者,和/或祖父母、外祖父母等或者同一對(duì)父母的其它胚胎樣本,提取基因組DNA,根據(jù)新一代測(cè)序平臺(tái)要求構(gòu)建文庫,并進(jìn)行測(cè)序。7)胚胎遺傳相關(guān)個(gè)體DNA測(cè)序數(shù)據(jù)進(jìn)行過濾,并與人類基因組參考序列比對(duì)。8)根據(jù)比對(duì)結(jié)果,分析確定先證者、父母等遺傳相關(guān)個(gè)體的基因型。9)利用先證者、父母等遺傳相關(guān)個(gè)體的基因型,推斷父母雙親的單倍體型。10)借助隱馬爾科夫模型解碼方式,用父母單倍體型結(jié)果推斷胚胎單體型。11)胚胎遺傳變異的最終確定。參考圖1,本發(fā)明實(shí)施例中信息分析部分用到的隱馬爾科夫模型以及詳細(xì)分析步驟如下:標(biāo)記:1、需要檢測(cè)的位點(diǎn)數(shù)為N。2、觀測(cè)序列:3、隱藏狀態(tài)集為:S={0,1},定義了父母哪條染色體遺傳給了子代。0代表遺傳給了先證者的那條染色體。4、觀測(cè)狀態(tài)集為:V={0,1}。1代表遺傳給先證者的染色體與胚胎遺傳草圖基因型一致。0代表不一致。第一步,構(gòu)建初始狀態(tài)概率分布向量,單倍體重組轉(zhuǎn)移矩陣以及觀察序列概率矩陣I.初始狀態(tài)概率分布記為π={πi},(i∈S,πi=0.5)在沒有參考數(shù)據(jù)的情況下,設(shè)每種隱藏狀態(tài)出現(xiàn)的可能性相等。II.記單倍體重組轉(zhuǎn)移矩陣記為A={aij},(i,j∈S),即隱藏狀態(tài)轉(zhuǎn)移的概率。Nr,Np分別表示期望重組數(shù)和單核苷酸多態(tài)性位點(diǎn)數(shù)。構(gòu)建觀察序列概率矩陣記觀察序列概率矩陣為B={bi(k)},(i∈S,k∈V),這里的概率分布用子代一定是純合(Must-hom)或一定是雜合(Must-het)的位點(diǎn)來估算。第二步,構(gòu)建局部概率矩陣,和逆向指針定義局部概率:δt(j)=max[δt-1(i)·aij]·bj(K)t∈{1...N}定義逆向指針:Ψi(j)=argmaxδt-1(i)·aijt∈{1...N}第三步,確定最終狀態(tài)狀態(tài),并回溯最優(yōu)路徑確定最終狀態(tài),回溯最優(yōu)路徑,即最可能胚胎單基因型qt*=Ψt+1(q*t+1)(t=1,2,3,...,N-1)第四步,輸出結(jié)果實(shí)施例1一、樣品收集及處理:一對(duì)夫婦曾生育過一個(gè)重度β地中海貧血的女兒A(先證者),因此接受IVF(體外受精聯(lián)合胚胎移植技術(shù))-PGD治療,希望能再生育一個(gè)與先證者HLA配型相符的健康寶寶。經(jīng)過一個(gè)IVF-PGD治療周期,在第三天進(jìn)行卵裂球胚胎單細(xì)胞活檢取樣,活檢后的卵裂球繼續(xù)培養(yǎng)至第五天囊胚期,進(jìn)行囊胚玻璃化冷凍保存?;顧z獲得的卵裂球單細(xì)胞樣本進(jìn)行全基因組擴(kuò)增(PED7-1-OWGA),全基因組擴(kuò)增采用Qiagen公司的REPLI-gMDA擴(kuò)增試劑盒,嚴(yán)格根據(jù)試劑盒說明書進(jìn)行操作,擴(kuò)增產(chǎn)物用于新一代測(cè)序及其他分析。同時(shí)也收集這個(gè)家系中父親(PED4-F)、母親(PED3-M)和先證者女兒(PED-Sister)的外周血,提取基因組DNA。在完成IVF-PGD治療后,選擇正確的胚胎植入子宮,成功妊娠后,可以在14周以后抽取孕婦羊水(PED7-2-OAF),或收集胚胎臍帶血,提取DNA,進(jìn)行測(cè)序,以驗(yàn)證胚胎細(xì)胞的分型結(jié)果。胚胎單細(xì)胞全基因組擴(kuò)增產(chǎn)物DNA用CovarisTM打斷儀打斷至200bp大小的片段,根據(jù)公司HiSeq2000TM測(cè)序儀的上機(jī)要求進(jìn)行建庫,構(gòu)建好的文庫經(jīng)Bioanalyzer2100和Q-PCR方法進(jìn)行質(zhì)控,合格的文庫繼續(xù)進(jìn)行HiSeq2000TM測(cè)序儀測(cè)序,測(cè)序策略為PairEnd90index(即雙向90bpindex測(cè)序),測(cè)序深度30X,全基因組測(cè)序。其中儀器的參數(shù)設(shè)置及操作方法都按照操作手冊(cè)(可由http://www.illumina.com/support/documentation.ilmn獲取)。父親、母親和先證者女兒外周血DNA,以及孕婦羊水或胚胎臍帶血DNA用CovarisTM打斷儀打斷至200bp大小的片段,根據(jù)公司HiSeq2000TM測(cè)序儀的上機(jī)要求進(jìn)行建庫,文庫進(jìn)行AllinOne芯片捕獲,具體操作見NimbleGenSeqCapEZ芯片捕獲建庫說明書(http://www.nimblegen.com/products/seqcap/ez/index.html可獲取)。AllinOne芯片是自主設(shè)計(jì)的目標(biāo)區(qū)域捕獲芯片,其目標(biāo)區(qū)域包括全外顯子區(qū)域、1M的SNP位點(diǎn)區(qū)域和MHC基因區(qū)。芯片捕獲后的文庫經(jīng)Bioanalyzer2100和Q-PCR方法進(jìn)行質(zhì)控,合格的文庫繼續(xù)進(jìn)行HiSeq2000TM測(cè)序儀測(cè)序,測(cè)序策略為PairEnd90index,測(cè)序深度為目標(biāo)區(qū)域的30-50X。其中儀器的參數(shù)設(shè)置及操作方法都按照操作手冊(cè)(可由http://www.illumina.com/support/documentation.ilmn獲取)。二、測(cè)序數(shù)據(jù)分析:1、先證者和父母基因組DNA測(cè)序分型:a)過濾掉低質(zhì)量值和接頭污染的序列b)使用Burrows-WheelerAligner(BWA,http://bio-bwa.sourceforge.net/)將高質(zhì)量的測(cè)序序列比對(duì)在人類參考基因組(Hg19,NCBIreleaseGRCh37)。并用SAMtools去除掉PCR重復(fù)擴(kuò)增的序列。c)使用GenomeAnalysisToolkit(GATK,http://www.broadinstitute.org/gatk/)校準(zhǔn)堿基質(zhì)量值并進(jìn)行單堿基核苷酸多態(tài)性和缺失重復(fù)的檢測(cè)。2、胚胎基因組遺傳草圖構(gòu)建。3、根據(jù)先證者基因型推斷父母的單倍體型:根據(jù)核心家系推斷單體型,具體可參考文獻(xiàn)B.L.BrowningandS.R.Browning.AmJHumGenet84:210-223.(2009)進(jìn)行。4、根據(jù)父母單體型推斷胚胎細(xì)胞的單倍體型:a)使用BWA將胚胎單細(xì)胞測(cè)序數(shù)據(jù)比對(duì)到人類參考基因組(Hg19,NCBIreleaseGRCh37)b)構(gòu)建初始狀態(tài)概率向量,以及胚胎單倍體重組轉(zhuǎn)移矩陣,Nr=30,其它按上所述。c)統(tǒng)計(jì)胚胎細(xì)胞每個(gè)位點(diǎn)的測(cè)序信息,并構(gòu)建觀察序列概率矩陣(按上所述)。d)構(gòu)建局部概率矩陣,和逆向指針(按上所述)。e)確定最終狀態(tài),并回溯最優(yōu)路徑f)輸出g)以胚胎出生后的羊水基因分型結(jié)果為參照,對(duì)胚胎細(xì)胞的基因分型準(zhǔn)確性統(tǒng)計(jì)如下:注:“草圖雜合”表示重構(gòu)前后均為雜合的位點(diǎn);“更正雜合”表示重構(gòu)前為純合,重構(gòu)后為雜合的位點(diǎn)。5、β-地貧和HLA型別判斷a)通過父母單體型,成功還原了胚胎細(xì)胞在rs7480526上的基因型,預(yù)測(cè)其為β-地貧陰性,并發(fā)現(xiàn)與先證者在該位置上的等位基因不一樣,從而確定胚胎為β-地貧陰性。b)通過本方法可以得出,先證者和胚胎在MHC區(qū)的單體型一樣,從而判斷她們的HLA型別是匹配的。根據(jù)上述胚胎的β-地貧基因型和HLA分型結(jié)果,從而選擇正確的胚胎,即β-地貧陰性和HLA型別與先證者匹配的胚胎,進(jìn)行冷凍復(fù)蘇和植入子宮,從而防止患病兒的妊娠。實(shí)施例2一、樣品收集及處理:一對(duì)夫婦均為β-地貧攜帶者,接受IVF-PGD治療。經(jīng)過一個(gè)IVF-PGD治療周期,在第三天獲得了8個(gè)卵裂球胚胎,均進(jìn)行卵裂球胚胎單細(xì)胞活檢取樣,活檢后的卵裂球繼續(xù)培養(yǎng)至第五天囊胚期,進(jìn)行囊胚玻璃化冷凍保存。活檢獲得的8個(gè)卵裂球單細(xì)胞樣本進(jìn)行全基因組擴(kuò)增,全基因組擴(kuò)增采用Qiagen公司的REPLI-gMDA擴(kuò)增試劑盒,嚴(yán)格根據(jù)試劑盒說明書進(jìn)行操作,擴(kuò)增產(chǎn)物用于新一代測(cè)序及其他分析。同時(shí)也收集這個(gè)家系中父親、母親的外周血,提取基因組DNA。在完成IVF-PGD治療,選擇正確的胚胎植入子宮,成功妊娠后,可以在14周以后抽取孕婦羊水,或收集胚胎臍帶血,提取DNA,進(jìn)行測(cè)序,以驗(yàn)證胚胎細(xì)胞的分型結(jié)果。8個(gè)胚胎單細(xì)胞全基因組擴(kuò)增產(chǎn)物DNA,父親、母親外周血DNA,以及孕婦羊水或胚胎臍帶血DNA用CovarisTM打斷儀打斷至200bp大小的片段,根據(jù)公司HiSeq2000TM測(cè)序儀的上機(jī)要求進(jìn)行建庫,文庫進(jìn)行AllinOne芯片捕獲,具體操作見NimbleGenSeqCapEZ芯片捕獲建庫說明書(http://www.nimblegen.com/products/seqcap/ez/index.html可獲取)。AllinOne芯片是自主設(shè)計(jì)的目標(biāo)區(qū)域捕獲芯片,其目標(biāo)區(qū)域包括全外顯子區(qū)域、1M的SNP位點(diǎn)區(qū)域和MHC基因區(qū)。芯片捕獲后的文庫經(jīng)Bioanalyzer2100和Q-PCR方法進(jìn)行質(zhì)控,合格的文庫繼續(xù)進(jìn)行HiSeq2000TM測(cè)序儀測(cè)序,測(cè)序策略為PairEnd90index(即雙向90bpindex測(cè)序),測(cè)序深度為目標(biāo)區(qū)域的30-50X。其中儀器的參數(shù)設(shè)置及操作方法都按照模作手冊(cè)(可由http://www.illumina.com/support/documentation.ilmn獲取)。二、測(cè)序數(shù)據(jù)分析:1)父母基因組DNA,羊水DNA(驗(yàn)證樣本)測(cè)序數(shù)據(jù)分析和分型:a)過濾掉低質(zhì)量值和接頭污染的序列b)使用Burrows-WheelerAligner(BWA,http://bio-bwa.sourceforge.net/)將高質(zhì)量的測(cè)序序列比對(duì)在人類參考基因組(Hg19,NCBIreleaseGRCh37)。并用SAMtools去除掉PCR重復(fù)擴(kuò)增的序列。c)使用GenomeAnalysisToolkit(GATK,http://www.broadinstitute.org/gatk/)校準(zhǔn)堿基質(zhì)量值并進(jìn)行單堿基核苷酸多態(tài)性和缺失重復(fù)的檢測(cè)。2)根據(jù)8個(gè)胚胎單細(xì)胞測(cè)序數(shù)據(jù)分析,分別給出每個(gè)胚胎細(xì)胞基因組初始化的基因型信息,構(gòu)建每個(gè)胚胎的細(xì)胞基因組遺傳草圖。3)確定8個(gè)胚胎單細(xì)胞任一個(gè)待測(cè)胚胎,根據(jù)待測(cè)胚胎細(xì)胞基因組遺傳草圖和父母的基因型,對(duì)父母的單倍體型進(jìn)行初始化。4)借助隱馬爾科夫模型,分別根據(jù)其余7個(gè)胚胎的基因型重構(gòu)并確定父母的單倍體型。5)借助隱馬爾科夫模型,根據(jù)父母單倍體型,來重構(gòu)待測(cè)胚胎的單體型。6)待測(cè)胚胎遺傳變異信息的確定。以22號(hào)染色體為例,參照羊水基因分型結(jié)果,對(duì)待測(cè)胚胎的基因分型準(zhǔn)確性統(tǒng)計(jì)如下:7)β-地貧和HLA型別判斷a)通過父母單體型,成功還原了待測(cè)胚胎細(xì)胞在rs7480526上的單體型,預(yù)測(cè)其為β-地貧陰性。b)通過本方法,結(jié)合先癥者的遺傳檢測(cè)結(jié)果,可判定先證者和胚胎在MHC區(qū)的單體型是否一致,從而判斷她們的HLA型別是否匹配。根據(jù)上述胚胎的β-地貧基因型和HLA分型結(jié)果,從而選擇正確的胚胎,即β-地貧陰性和HLA型別與先癥者匹配的胚胎,進(jìn)行冷凍復(fù)蘇和植入子宮,從而防止患病兒的妊娠。工業(yè)實(shí)用性本發(fā)明的確定胚胎基因組中預(yù)定區(qū)域堿基信息的方法、用于確定胚胎基因組中預(yù)定區(qū)域堿基信息的系統(tǒng)以及計(jì)算機(jī)可讀介質(zhì),能夠有效地應(yīng)用于對(duì)胚胎基因組中預(yù)定區(qū)域的核酸序列進(jìn)行分析。盡管本發(fā)明的具體實(shí)施方式已經(jīng)得到詳細(xì)的描述,本領(lǐng)域技術(shù)人員將會(huì)理解。根據(jù)已經(jīng)公開的所有教導(dǎo),可以對(duì)那些細(xì)節(jié)進(jìn)行各種修改和替換,這些改變均在本發(fā)明的保護(hù)范圍之內(nèi)。本發(fā)明的全部范圍由所附權(quán)利要求及其任何等同物給出。在本說明書的描述中,參考術(shù)語“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示意性實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對(duì)上述術(shù)語的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1