本發(fā)明涉及生物醫(yī)學(xué)領(lǐng)域,具體的,確定染色體中微缺失和微重復(fù)的方法及設(shè)備。
背景技術(shù):
:在無(wú)創(chuàng)產(chǎn)前檢測(cè)(NIPT)臨床領(lǐng)域,胎兒微缺失微重復(fù)的篩查靈敏度較低?,F(xiàn)有基于母親外周血估算胎兒染色體微缺失微重復(fù)的方法主要分為以下兩個(gè)方向:1)基于在母親血漿中胚胎DNA序列比例的變化估算微缺失微重復(fù)。2)利用單核苷酸多態(tài)性(SNPs)位點(diǎn)表現(xiàn)的差異化,選擇多個(gè)SNP位點(diǎn)進(jìn)行估算。現(xiàn)有的檢測(cè)方法都存在一定的局限性,檢測(cè)的方法1)精度較低,會(huì)出現(xiàn)大量的假陽(yáng)性結(jié)果,由于結(jié)果僅根據(jù)某區(qū)域內(nèi)片段的比例的變化來(lái)得出檢測(cè)結(jié)果,缺乏有效的過(guò)濾方法,假陽(yáng)性的出現(xiàn)很難避免。方法2)需要探針捕獲和高深度測(cè)序,或者需要獲得父源性信息,高深度捕獲需要設(shè)計(jì)芯片,增加了實(shí)驗(yàn)的難度,高深度測(cè)序會(huì)增加一定的成本,未被捕獲的部分則不能進(jìn)行測(cè)定。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的在于,提供一種確定胎兒染色體中微缺失微重復(fù)的方法及設(shè)備,該方法通過(guò)計(jì)算胎兒微缺失微重復(fù)的片段濃度及胎兒本身核酸的濃度,對(duì)微缺失微重復(fù)進(jìn)行評(píng)估,降低假陽(yáng)性率,精準(zhǔn)度高?;谝陨夏康?,本發(fā)明一方面提供一種確定胎兒染色體中微缺失重復(fù)的方法,包括以下步驟:S1、獲得含有微缺失微重復(fù)片段的濃度f(wàn)m;S2、獲得男性胎兒核酸濃度f(wàn)y或女性胎兒核酸濃度f(wàn)s;S3、計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與男性胎兒核酸濃度f(wàn)y的比值rmY=fm/fy,或計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與女性胎兒核酸濃度f(wàn)s的比值rms=fm/fs;S4、根據(jù)缺失的拷貝數(shù)或重復(fù)的拷貝數(shù)計(jì)算rmY或rms,過(guò)濾掉假陽(yáng)性;S5、取rmY的小數(shù)部分dmY,或rms的小數(shù)部分dms,判斷dmY或dms是否為陽(yáng)性,否則過(guò)濾掉結(jié)果;S6、計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與男性胎兒核酸濃度f(wàn)y的和為amY=fm+fy,或計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與女性胎兒核酸濃度f(wàn)s的和為ams=fm+fs;S7、根據(jù)判定原則對(duì)微缺失微重復(fù)的片段進(jìn)行過(guò)濾,過(guò)濾后得到胎兒染色體微缺失微重復(fù)片段。本發(fā)明另一方面還提供一種確定胎兒染色體中微缺失微重復(fù)的設(shè)備,包括:微缺失微重復(fù)片段濃度計(jì)算裝置,用于獲得含有微缺失微重復(fù)片段的濃度f(wàn)m;胎兒核酸濃度獲得裝置,用于獲得男性胎兒核酸濃度f(wàn)y或女性胎兒核酸濃度f(wàn)s;比值計(jì)算裝置,用于計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與男性胎兒核酸濃度f(wàn)y的比值rmY=fm/fy,或計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與女性胎兒核酸濃度f(wàn)s的比值rms=fm/fs;第一過(guò)濾裝置,用于根據(jù)缺失的拷貝數(shù)或重復(fù)的拷貝數(shù)計(jì)算rmY或rms,過(guò)濾掉假陽(yáng)性;第二過(guò)濾裝置,用于取rmY的小數(shù)部分dmY,或rms的小數(shù)部分dms,判斷dmY或dms是否為陽(yáng)性,否則過(guò)濾掉結(jié)果;和值計(jì)算裝置,用于計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與男性胎兒核酸濃度f(wàn)y的和為amY=fm+fy,或計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與女性胎兒核酸濃度f(wàn)s的和為ams=fm+fs;第三過(guò)濾裝置,用于根據(jù)判定原則對(duì)微缺失微重復(fù)片段進(jìn)行過(guò)濾,過(guò)濾后得到胎兒染色體微缺失微重復(fù)片段。本發(fā)明提供的方法及裝置,能夠精確的確定染色體中的微缺失微重復(fù),尤其適用于確定孕婦外周血中的胎兒染色體的微缺失微重復(fù)。同現(xiàn)有技術(shù)相比:1、本發(fā)明不需要額外的芯片設(shè)計(jì),節(jié)省了芯片設(shè)計(jì)的費(fèi)用,并使得實(shí)驗(yàn)方法簡(jiǎn)單。2、不需要高深度的測(cè)序,在用全基因組數(shù)據(jù)進(jìn)行染色體非整倍性的基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行后續(xù)的處理,能夠直接得出準(zhǔn)確的微缺失微重復(fù)結(jié)果,無(wú)需增加數(shù)據(jù)量。3、克服了現(xiàn)有技術(shù)中采用snp的方法可能會(huì)遺漏一些捕獲無(wú)法達(dá)到的區(qū)域,本發(fā)明可以在全基因組上進(jìn)行檢測(cè)。4、首次實(shí)現(xiàn)了用全基因組測(cè)序的方法,判斷胎兒微缺失微重復(fù)濃度。5、降低了假陽(yáng)性,提高了準(zhǔn)確度。6、去除了母體微缺失微重復(fù)對(duì)胎兒的影響,提高準(zhǔn)確度。附圖說(shuō)明圖1是本發(fā)明一實(shí)施例中確定胎兒染色體微缺失微重復(fù)的方法的流程圖。圖2是圖1實(shí)施例中的獲得含有微缺失微重復(fù)的片段的濃度f(wàn)m的方法的流程圖。圖3是圖1實(shí)施例中的獲得含有微缺失微重復(fù)終極窗口的方法的流程圖。圖4是圖1實(shí)施例中的獲得男性胎兒核酸濃度f(wàn)y的方法的流程圖。圖5是圖1實(shí)施例中的獲得女性胎兒核酸濃度f(wàn)s的方法的流程圖。圖6是圖5方法中的獲得預(yù)定范圍的方法的流程圖。圖7是圖5方法中的獲得預(yù)定的函數(shù)的方法的流程圖。圖8是本發(fā)明另一實(shí)施例中確定胎兒染色體中微缺失微重復(fù)的設(shè)備的結(jié)構(gòu)框圖。圖9是圖8實(shí)施例中的含有微缺失微重復(fù)片段的濃度計(jì)算裝置的結(jié)構(gòu)框圖。圖10是圖8實(shí)施例中的微缺失微重復(fù)所在終極窗口獲得單元的結(jié)構(gòu)框圖。圖11是圖8實(shí)施例中的男性胎兒核酸濃度f(wàn)y獲得單元的結(jié)構(gòu)框圖。圖12是圖8實(shí)施例中的女性胎兒核酸濃度f(wàn)s獲得單元的結(jié)構(gòu)框圖。圖13是圖8實(shí)施例中的預(yù)定范圍確定元件的結(jié)構(gòu)框圖。圖14是圖8實(shí)施例中的預(yù)定函數(shù)確定元件的結(jié)構(gòu)框圖。圖15是實(shí)施例2中19個(gè)樣本微缺失微重復(fù)結(jié)果展示圖。主要元件符號(hào)說(shuō)明如下具體實(shí)施方式將結(jié)合上述附圖進(jìn)一步說(shuō)明本發(fā)明。具體實(shí)施方式下面詳細(xì)描述本發(fā)明的實(shí)施例。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。需要說(shuō)明的是,術(shù)語(yǔ)“初級(jí)”、“次級(jí)”、“終極”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“初級(jí)”、“次級(jí)”、“終極”的特征可以明示或者隱含地包括一個(gè)或更多個(gè)該特征。進(jìn)一步地,在本發(fā)明的描述中,除非另有說(shuō)明,“多個(gè)”的含義是兩個(gè)或兩個(gè)以上。本發(fā)明中的“唯一比對(duì)序列”、“唯一比對(duì)測(cè)序序列”有時(shí)也可稱(chēng)之為“序列”、“測(cè)序序列”。術(shù)語(yǔ)“母體樣品”在本文中是指這樣的生物樣品,其獲自妊娠受試者,例如,婦女。術(shù)語(yǔ)“微缺失微重復(fù)”是指染色體上出現(xiàn)長(zhǎng)度為1.5kb-10Mb的缺失或重復(fù)。術(shù)語(yǔ)“GC修正”是指對(duì)序列中的GC含量進(jìn)行修正。參見(jiàn)圖1,本發(fā)明提供一種確定胎兒染色體微缺失微重復(fù)的方法,包括:S1、獲得含有微缺失微重復(fù)片段的濃度f(wàn)m;S2、獲得男性胎兒核酸濃度f(wàn)y或女性胎兒核酸濃度f(wàn)s;S3、計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與男性胎兒核酸濃度f(wàn)y的比值rmY=fm/fy,或計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與女性胎兒核酸濃度f(wàn)s的比值rms=fm/fs;S4、根據(jù)缺失的拷貝數(shù)或重復(fù)的拷貝數(shù)計(jì)算rmY或rms,過(guò)濾掉假陽(yáng)性;S5、取rmY的小數(shù)部分dmY,或rms的小數(shù)部分dms,判斷dmY或dms是否為陽(yáng)性,否則過(guò)濾掉結(jié)果;S6、計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與男性胎兒核酸濃度f(wàn)y的和為amY=fm+fy,或計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與女性胎兒核酸濃度f(wàn)s的和為ams=fm+fs;S7、根據(jù)判定原則對(duì)微缺失微重復(fù)的片段進(jìn)行過(guò)濾,過(guò)濾后得到胎兒染色體微缺失微重復(fù)片段。發(fā)明人驚奇的發(fā)現(xiàn),利用本發(fā)明的方法能夠精確的確定染色體中的微缺失微重復(fù),尤其適用于確定孕婦外周血中的胎兒染色體的微缺失微重復(fù)。參見(jiàn)圖2,根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述步驟S1中含有微缺失微重復(fù)片段的濃度f(wàn)m通過(guò)如下步驟獲得:S11、根據(jù)含有微缺失微重復(fù)的初級(jí)窗口,獲得不含微缺失微重復(fù)的初級(jí)窗口,計(jì)算含有微缺失微重復(fù)的初級(jí)窗口的總序列數(shù)和含有微缺失微重復(fù)的初級(jí)窗口的總數(shù)目,以及不含有微缺失微重復(fù)的初級(jí)窗口的總序列數(shù)和不含有微缺失微重復(fù)的初級(jí)窗口的總數(shù)目;S12、獲得含有微缺失微重復(fù)的初級(jí)窗口的平均深度d1,d1=含有微缺失微重復(fù)的初級(jí)窗口的總序列數(shù)/含有微缺失微重復(fù)的初級(jí)窗口的總數(shù)目;S13、獲得不含微缺失微重復(fù)的初級(jí)窗口的平均深度d2,d2=不含微缺失微重復(fù)的初級(jí)窗口的總序列數(shù)/不含微缺失微重復(fù)的初級(jí)窗口的總數(shù)目;S14、計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m,fm=2×︱d2-d1︱/d2。本領(lǐng)域技術(shù)人員可以理解的,所述不含微缺失微重復(fù)的初級(jí)窗口的總數(shù)目及序列數(shù)可由含有微缺失微重復(fù)終極窗口的方法推導(dǎo)得到。例如,終極窗口有個(gè)起始和終止位置的絕對(duì)坐標(biāo),根據(jù)與次級(jí)窗口的坐標(biāo)的關(guān)系,找到次級(jí)窗口的坐標(biāo),然后確認(rèn)次級(jí)窗口有多少初級(jí)窗口在,去掉最初和最后的初級(jí)窗口,以排除數(shù)據(jù)的波動(dòng),然后得到最終的初級(jí)窗口,計(jì)算得到總序列數(shù)。參見(jiàn)圖3,根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述含有微缺失微重復(fù)的終極窗口通過(guò)以下步驟獲得:S111、對(duì)含有游離核酸的生物樣本進(jìn)行核酸測(cè)序,以便獲得由多個(gè)測(cè)序數(shù)據(jù)構(gòu)成的測(cè)序結(jié)果;S112、將所述測(cè)序結(jié)果與參考基因組進(jìn)行比對(duì),以便構(gòu)建唯一比對(duì)測(cè)序序列集,所述唯一比對(duì)測(cè)序序列集中的每一個(gè)測(cè)序序列僅能夠與所述參考基因組的一個(gè)位置匹配;S113、確定所述唯一比對(duì)測(cè)序序列集中各唯一比對(duì)測(cè)序序列的長(zhǎng)度;S114、按照預(yù)定長(zhǎng)度將參考基因組劃分為多個(gè)初級(jí)窗口,所述預(yù)定長(zhǎng)度為1bp~5M;S115、統(tǒng)計(jì)所述各唯一比對(duì)測(cè)序序列落入各個(gè)初級(jí)窗口的數(shù)目;S116、對(duì)落入初級(jí)窗口中的序列數(shù)進(jìn)行GC修正,以及對(duì)修正后的結(jié)果進(jìn)行批次間調(diào)整;S117、將預(yù)定數(shù)目個(gè)相鄰的初級(jí)窗口合并為多個(gè)次級(jí)窗口,確定各個(gè)次級(jí)窗口中的序列數(shù)目;S118、對(duì)各個(gè)次級(jí)窗口進(jìn)行統(tǒng)計(jì)檢驗(yàn),計(jì)算出T1值,根據(jù)所述T1值過(guò)濾所述次級(jí)窗口;S119、對(duì)過(guò)濾后的次級(jí)窗口進(jìn)行統(tǒng)計(jì)檢驗(yàn),計(jì)算出T2值,根據(jù)所述T2值將相鄰兩個(gè)無(wú)顯著性差異的次級(jí)窗口合并為終極窗口;S120、重復(fù)步驟S118-S120,直至無(wú)法合并;S121、對(duì)最終合并得到的終極窗口進(jìn)行假設(shè)檢驗(yàn),獲得含有微缺失微重復(fù)的終極窗口。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述含有游離核酸的生物樣本為孕婦外周血中的游離胎兒核酸。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述核酸為DNA。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述測(cè)序結(jié)果包括所述游離核酸的長(zhǎng)度及堿基排列順序。所述“長(zhǎng)度”是指核酸的長(zhǎng)度,可以用堿基對(duì)即bp作為單位。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述測(cè)序?yàn)殡p末端測(cè)序、單末端測(cè)序或單分子測(cè)序。由此,容易得到游離核酸的長(zhǎng)度,有利于后續(xù)步驟的進(jìn)行。本領(lǐng)域技術(shù)人員可以理解的,由于血樣中游離胎兒DNA比較短,因需要獲得所有游離DNA分子的長(zhǎng)度,從而單末端測(cè)序需測(cè)通整條游離DNA分子,或者采用雙末端測(cè)序。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述步驟S114中的預(yù)定長(zhǎng)度為1bp~5M,所述步驟S117中的預(yù)定數(shù)目為5~100個(gè)。優(yōu)選所述預(yù)定長(zhǎng)度為20~40Kb。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述GC修正的方法包括采用局部加權(quán)回歸法,線性回歸法或邏輯回歸法。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述批次間調(diào)整為用測(cè)序的批次內(nèi)所有樣本計(jì)算對(duì)應(yīng)的每個(gè)初級(jí)窗口的基線,根據(jù)基線對(duì)每個(gè)初級(jí)窗口內(nèi)的唯一比對(duì)測(cè)序序列的數(shù)目進(jìn)行加權(quán)修正。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述步驟S118中T1值包括根據(jù)Z檢驗(yàn)或T檢驗(yàn)計(jì)算得到,所述過(guò)濾為將T1值在-3~3之間的次級(jí)窗口過(guò)濾掉。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述步驟S119中T2值包括根據(jù)秩和檢驗(yàn)、符號(hào)檢驗(yàn)或游程檢驗(yàn)計(jì)算得到,所述無(wú)顯著性差異為相鄰兩個(gè)窗口的T2值在-3~3之間。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述步驟S121中假設(shè)檢驗(yàn)包括根據(jù)Z檢驗(yàn)或T檢驗(yàn)計(jì)算得到,所述檢驗(yàn)閾值定義為3。也即,當(dāng)檢驗(yàn)的統(tǒng)計(jì)量>3或者<-3,判定為含有微缺失微重復(fù)的終極窗口。參見(jiàn)圖4,根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述步驟S2中所述男性胎兒核酸濃度f(wàn)y通過(guò)如下步驟獲得:S211、對(duì)含有游離核酸的生物樣本進(jìn)行測(cè)序,獲得由多個(gè)測(cè)序數(shù)據(jù)構(gòu)成的測(cè)序結(jié)果;S212、根據(jù)所述測(cè)序結(jié)果確定所述樣品中的Y染色體中唯一比對(duì)測(cè)序序列落入初級(jí)窗口的數(shù)目;S213、統(tǒng)計(jì)Y染色體上各初級(jí)窗口中唯一比對(duì)測(cè)序序列的數(shù)目總和以及所述初級(jí)窗口的總數(shù)目;S214、獲得Y染色體中初級(jí)窗口的平均深度dy,dy=Y(jié)染色體上唯一比對(duì)測(cè)序序列數(shù)目總和/Y染色體上初級(jí)窗口的數(shù)目;S215、獲得男性胎兒核酸濃度f(wàn)y,fy=2×dy/d2,所述d2為不含微缺失微重復(fù)的初級(jí)窗口的平均深度,d2=不含微缺失微重復(fù)的初級(jí)窗口的總序列數(shù)/不含微缺失微重復(fù)的初級(jí)窗口的數(shù)目。本領(lǐng)域技術(shù)人員可以理解的,所述不含微缺失微重復(fù)的初級(jí)窗口的總數(shù)目及序列數(shù)可由含有微缺失微重復(fù)終極窗口的方法推導(dǎo)得到。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述步驟S212進(jìn)一步包括:按照預(yù)定長(zhǎng)度將參考基因組劃分為多個(gè)初級(jí)窗口,去除Y染色體中唯一比對(duì)序列數(shù)目大于平均序列數(shù)目5倍以上的初級(jí)窗口。優(yōu)選的,所述初級(jí)窗口為經(jīng)過(guò)GC修改調(diào)整后的初級(jí)窗口。參見(jiàn)圖5,根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述步驟S2中女性胎兒核酸濃度f(wàn)s通過(guò)如下步驟獲得:S221、對(duì)含有游離核酸的生物樣本進(jìn)行測(cè)序,獲得由多個(gè)測(cè)序數(shù)據(jù)構(gòu)成的測(cè)序結(jié)果;S222、根據(jù)所述測(cè)序結(jié)果,確定所述樣品中長(zhǎng)度落入預(yù)定范圍的唯一比對(duì)測(cè)序序列的數(shù)目;S223、基于所述長(zhǎng)度落入預(yù)定范圍的唯一比對(duì)測(cè)序序列的數(shù)目,確定在所述預(yù)定范圍內(nèi)出現(xiàn)唯一比對(duì)測(cè)序序列的頻率;S224、根據(jù)所述預(yù)定范圍內(nèi)出現(xiàn)唯一比對(duì)測(cè)序序列的頻率,根據(jù)預(yù)定函數(shù),確定所述樣本中女性胎兒核酸濃度f(wàn)s。參見(jiàn)圖6,根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述步驟S222中預(yù)定范圍通過(guò)如下步驟確定:S2221、確定所述多個(gè)對(duì)照樣品中所包含的唯一比對(duì)測(cè)序序列的長(zhǎng)度;S2222、設(shè)定多個(gè)候選長(zhǎng)度范圍,并分別確定所述多個(gè)對(duì)照樣品在各候選長(zhǎng)度范圍內(nèi)出現(xiàn)的唯一比對(duì)測(cè)序序列的頻率;S2223、基于所述多個(gè)對(duì)照樣品在各候選長(zhǎng)度范圍內(nèi)出現(xiàn)唯一比對(duì)測(cè)序序列的頻率以及所述對(duì)照樣品中核酸的濃度,確定各所述候選長(zhǎng)度范圍與所述對(duì)照樣品中核酸的濃度的相關(guān)性系數(shù);S2224、基于所述相關(guān)性系數(shù)的數(shù)值,確定至少一個(gè)候選長(zhǎng)度范圍或者候選長(zhǎng)度范圍組合作為所述預(yù)定范圍。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述預(yù)定范圍是基于多個(gè)對(duì)照樣品確定的,其中,所述對(duì)照樣品中核酸的濃度是已知的,優(yōu)選的,所述預(yù)定范圍是基于至少20個(gè)對(duì)照樣品確定的。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述對(duì)照樣品為已知游離胎兒核酸比例的懷有正常男胎的孕婦外周血樣本,并且所述對(duì)照樣品中核酸濃度是利用Y染色體確定的。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述對(duì)照樣品中游離胎兒核酸濃度是利用Y染色體確定,也即通過(guò)本發(fā)明上述男性胎兒核酸濃度f(wàn)y的方法確定的。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述S2222中候選長(zhǎng)度范圍的跨度為1~300bp,優(yōu)選的為1~20bp。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述多個(gè)候選長(zhǎng)度范圍的步長(zhǎng)為1~2bp。例如,所述候選長(zhǎng)度范圍分別為1~20,2~21,3~22……,其中跨度為20bp,步長(zhǎng)為1bp。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述步驟S222中預(yù)定范圍為179bp-206bp。參見(jiàn)圖7,根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述步驟S223中預(yù)定的函數(shù)通過(guò)如下步驟獲得:S2231、分別在所述多個(gè)對(duì)照樣品中,確定在所述預(yù)定范圍內(nèi)出現(xiàn)唯一比對(duì)測(cè)序序列的頻率;S2232、將所述多個(gè)對(duì)照樣品中在所述預(yù)定范圍內(nèi)出現(xiàn)唯一比對(duì)測(cè)序序列的頻率與已知的核酸濃度進(jìn)行擬合,以便確定所述預(yù)定的函數(shù)。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述擬合為線性擬合。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述預(yù)定函數(shù)為d=-0.3215×p+1.62562,其中,d表示核酸濃度,p表示在所述預(yù)定范圍內(nèi)出現(xiàn)的唯一比對(duì)測(cè)序序列的頻率。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述步驟S4還包括:若根據(jù)所述缺失的拷貝數(shù)計(jì)算得到rmY≧2或所述重復(fù)的拷貝數(shù)計(jì)算得到rmY≧6,則判定為不可信,過(guò)濾掉假陽(yáng)性結(jié)果;或者,若根據(jù)所述缺失的拷貝數(shù)計(jì)算得到rms≧2或所述重復(fù)的拷貝數(shù)計(jì)算得到rms≧6,則判定為不可信,過(guò)濾掉假陽(yáng)性結(jié)果。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述步驟S5還包括:若dmY<0.13或dmY>0.85,則dmY為陽(yáng)性;或者,若dms<0.15或dms>0.791,則dms為陽(yáng)性。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述步驟S7中的判定原則為:若amY在0.95~1.05之間,則認(rèn)為所述微缺失微重復(fù)的片段來(lái)自于母親,過(guò)濾所述微缺失微重復(fù)的片段;或者,若ams在0.93~1.06之間,則認(rèn)為所述微缺失微重復(fù)的片段來(lái)自于母親,過(guò)濾所述微缺失微重復(fù)的片段。參見(jiàn)圖8,本發(fā)明一方面還提供一種確定胎兒染色體中微缺失微重復(fù)的設(shè)備100,包括:微缺失微重復(fù)片段濃度計(jì)算裝置110,用于獲得含有微缺失微重復(fù)片段的濃度f(wàn)m;胎兒核酸濃度獲得裝置120,用于獲得男性胎兒核酸濃度f(wàn)y或女性胎兒核酸濃度f(wàn)s;比值計(jì)算裝置130,用于計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與男性胎兒核酸濃度f(wàn)y的比值rmY=fm/fy,或計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與女性胎兒核酸濃度f(wàn)s的比值rms=fm/fs;第一過(guò)濾裝置140,用于根據(jù)缺失的拷貝數(shù)或重復(fù)的拷貝數(shù)計(jì)算rmY或rms,過(guò)濾掉假陽(yáng)性;第二過(guò)濾裝置150,用于取rmY的小數(shù)部分dmY,或rms的小數(shù)部分dms,判斷dmY或dms是否為陽(yáng)性,否則過(guò)濾掉結(jié)果;和值計(jì)算裝置160,用于計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與男性胎兒核酸濃度f(wàn)y的和為amY=fm+fy,或計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與女性胎兒核酸濃度f(wàn)s的和為ams=fm+fs;第三過(guò)濾裝置170,用于根據(jù)判定原則對(duì)微缺失微重復(fù)片段進(jìn)行過(guò)濾,過(guò)濾后得到胎兒染色體微缺失微重復(fù)片段。參見(jiàn)圖9,根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述微缺失微重復(fù)片段濃度計(jì)算裝置110進(jìn)一步包括:初極窗口獲得單元111,用于根據(jù)含有微缺失微重復(fù)的初級(jí)窗口,獲得不含微缺失微重復(fù)的初級(jí)窗口,計(jì)算含有微缺失微重復(fù)的初級(jí)窗口的總序列數(shù)和含有微缺失微重復(fù)的初級(jí)窗口的總數(shù)目,以及不含微缺失微重復(fù)的初級(jí)窗口的總序列數(shù)和不含有微缺失微重復(fù)的初級(jí)窗口的數(shù)目;第一平均深度獲得單元112,用于獲得含有微缺失微重復(fù)的初級(jí)窗口的平均深度d1,d1=含有微缺失微重復(fù)的初級(jí)窗口的總序列數(shù)/含有微缺失微重復(fù)的初級(jí)窗口的數(shù)目;第二平均深度獲得單元113,用于獲得不含微缺失微重復(fù)的初級(jí)窗口的平均深度d2,d2=不含微缺失微重復(fù)的初級(jí)窗口的總序列數(shù)/不含微缺失微重復(fù)的初級(jí)窗口的總數(shù)目;微缺失微重復(fù)片段濃度獲得單元114,用于計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m,fm=2×︱d2-d1︱/d2。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述微缺失微重復(fù)片段濃度計(jì)算裝置110進(jìn)一步包括微缺失微重復(fù)所在終極窗口獲得單元115,參見(jiàn)圖10,所述微缺失微重復(fù)所在終極窗口獲得單元115包括:第一測(cè)序元件1151,用于對(duì)含有游離核酸的生物樣本進(jìn)行核酸測(cè)序,以便獲得由多個(gè)測(cè)序數(shù)據(jù)構(gòu)成的測(cè)序結(jié)果;比對(duì)元件1152,用于將所述測(cè)序結(jié)果與參考基因組進(jìn)行比對(duì),以便構(gòu)建唯一比對(duì)測(cè)序序列集,所述唯一比對(duì)測(cè)序序列集中的每一個(gè)測(cè)序序列僅能夠與所述參考基因組的一個(gè)位置匹配;長(zhǎng)度確定元件1153,用于確定所述唯一比對(duì)測(cè)序序列集中各唯一比對(duì)測(cè)序序列的長(zhǎng)度;初級(jí)窗口確定元件1154,用于按照預(yù)定長(zhǎng)度將參考基因組劃分為多個(gè)初級(jí)窗口,所述預(yù)定長(zhǎng)度為1bp~5M;第一統(tǒng)計(jì)元件1155,用于統(tǒng)計(jì)所述各唯一比對(duì)測(cè)序序列落入各個(gè)初級(jí)窗口的數(shù)目;修正元件1156,用于對(duì)落入初級(jí)窗口中的序列數(shù)進(jìn)行GC修正,以及對(duì)修正后的結(jié)果進(jìn)行批次間調(diào)整;第一合并元件1157,用于將預(yù)定數(shù)目個(gè)相鄰的初級(jí)窗口合并為多個(gè)次級(jí)窗口,確定各個(gè)次級(jí)窗口中的序列數(shù)目;第一過(guò)濾元件1158,用于對(duì)各個(gè)次級(jí)窗口進(jìn)行統(tǒng)計(jì)檢驗(yàn),計(jì)算出T1值,根據(jù)所述T1值過(guò)濾所述次級(jí)窗口;第二合并元件1159,用于對(duì)過(guò)濾后的次級(jí)窗口進(jìn)行統(tǒng)計(jì)檢驗(yàn),計(jì)算出T2值,根據(jù)所述T2值將相鄰兩個(gè)無(wú)顯著性差異的次級(jí)窗口合并為終極窗口;重復(fù)元件1160,用于重復(fù)啟動(dòng)第一過(guò)濾元件1158、第二合并元件1159,直至無(wú)法合并;微缺失微重復(fù)終極窗口確定元件1161,用于對(duì)最終合并得到的終極窗口進(jìn)行假設(shè)檢驗(yàn),獲得含有微缺失微重復(fù)的終極窗口。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述第一合并元件1157中的預(yù)定數(shù)目為5~100個(gè)。優(yōu)選所述預(yù)定長(zhǎng)度為20~40Kb。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述修正元件1156中的GC修正的方法包括采用局部加權(quán)回歸法,線性回歸法或邏輯回歸法。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述修正元件1156中的批次間調(diào)整為用測(cè)序的批次內(nèi)所有樣本計(jì)算對(duì)應(yīng)的每個(gè)初級(jí)窗口的基線,根據(jù)基線對(duì)每個(gè)初級(jí)窗口內(nèi)的唯一比對(duì)測(cè)序序列的數(shù)目進(jìn)行加權(quán)修正。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述第一過(guò)濾元件1158中T1值包括根據(jù)Z檢驗(yàn)或T檢驗(yàn)計(jì)算得到,所述過(guò)濾為將T1值在-3~3之間的次級(jí)窗口過(guò)濾掉。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述第二合并元件1159中T2值包括根據(jù)秩和檢驗(yàn)、符號(hào)檢驗(yàn)或游程檢驗(yàn)計(jì)算得到,所述無(wú)顯著性差異為相鄰兩個(gè)窗口的T2值在-3~3之間。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述微缺失微重復(fù)終極窗口確定元件1161中的假設(shè)檢驗(yàn)包括根據(jù)Z檢驗(yàn)或T檢驗(yàn)計(jì)算得到,所述檢驗(yàn)閾值定義為3。也即,當(dāng)檢驗(yàn)的統(tǒng)計(jì)量>3或者<-3,判定為含有微缺失微重復(fù)的終極窗口。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述胎兒核酸濃度獲得裝置120進(jìn)一步包括男性胎兒核酸濃度f(wàn)y獲得單元121,參見(jiàn)圖11,所述男性胎兒核酸濃度f(wàn)y獲得單元121包括:第二測(cè)序元件1211,用于對(duì)含有游離核酸的生物樣本進(jìn)行測(cè)序,獲得由多個(gè)測(cè)序數(shù)據(jù)構(gòu)成的測(cè)序結(jié)果;第一數(shù)目確定元件1212,用于根據(jù)所述測(cè)序結(jié)果確定所述樣品中的Y染色體中唯一比對(duì)測(cè)序序列落入初級(jí)窗口的數(shù)目;第二統(tǒng)計(jì)元件1213,用于統(tǒng)計(jì)Y染色體上各初級(jí)窗口中唯一比對(duì)測(cè)序序列的數(shù)目總和以及所述初級(jí)窗口的總數(shù)目;平均深度獲得元件1214,用于獲得Y染色體中初級(jí)窗口的平均深度dy,dy=Y(jié)染色體上唯一比對(duì)測(cè)序序列數(shù)目總和/Y染色體上初級(jí)窗口的數(shù)目;男性胎兒核酸濃度獲得元件1215,用于獲得男性胎兒核酸濃度f(wàn)y,fy=2×dy/d2,所述d2為不含微缺失微重復(fù)的初級(jí)窗口的平均深度,d2=不含微缺失微重復(fù)的初級(jí)窗口的總序列數(shù)/不含微缺失微重復(fù)的初級(jí)窗口的數(shù)目。根據(jù)本發(fā)明的實(shí)施例,所述第一數(shù)目確定元件1212進(jìn)一步包括過(guò)濾模塊12121,所述過(guò)濾元件用于按照預(yù)定長(zhǎng)度將參考基因組劃分為多個(gè)初級(jí)窗口,去除Y染色體中唯一比對(duì)序列數(shù)目大于平均序列數(shù)目5倍以上的初級(jí)窗口。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述胎兒核酸濃度獲得裝置120進(jìn)一步包括女性胎兒核酸濃度f(wàn)s獲得單元122,參見(jiàn)圖12,所述女性胎兒核酸濃度f(wàn)s獲得單元122包括:第三測(cè)序元件1221,用于對(duì)含有游離核酸的生物樣本進(jìn)行測(cè)序,獲得由多個(gè)測(cè)序數(shù)據(jù)構(gòu)成的測(cè)序結(jié)果;第二數(shù)目確定元件1222,用于根據(jù)所述測(cè)序結(jié)果,確定所述樣品中長(zhǎng)度落入預(yù)定范圍的唯一比對(duì)測(cè)序序列的數(shù)目;頻率確定元件1223,用于基于所述長(zhǎng)度落入預(yù)定范圍的唯一比對(duì)測(cè)序序列的數(shù)目,確定在所述預(yù)定范圍內(nèi)出現(xiàn)唯一比對(duì)測(cè)序序列的頻率;女性胎兒核酸濃度確定元件1224,用于根據(jù)所述預(yù)定范圍內(nèi)出現(xiàn)的唯一比對(duì)測(cè)序序列的頻率,根據(jù)預(yù)定的函數(shù),確定所述樣本中女性胎兒核酸濃度f(wàn)s。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述女性胎兒核酸濃度f(wàn)s獲得單元122進(jìn)一步包括預(yù)定范圍確定元件1225,參見(jiàn)圖13,根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述預(yù)定范圍確定元件1225進(jìn)一步包括:長(zhǎng)度確定模塊12251,用于確定所述多個(gè)對(duì)照樣品中所包含的唯一比對(duì)測(cè)序序列的長(zhǎng)度;第一頻率確定模塊12252,用于設(shè)定多個(gè)候選長(zhǎng)度范圍,并分別確定所述多個(gè)對(duì)照樣品在各候選長(zhǎng)度范圍內(nèi)出現(xiàn)的唯一比對(duì)測(cè)序序列的頻率;相關(guān)性系數(shù)確定模塊12253,用于基于所述多個(gè)對(duì)照樣品在各候選長(zhǎng)度范圍內(nèi)出現(xiàn)唯一比對(duì)測(cè)序序列的頻率以及所述對(duì)照樣品中核酸的濃度,確定各所述候選長(zhǎng)度范圍與所述對(duì)照樣品中核酸的濃度的相關(guān)性系數(shù);預(yù)定范圍確定模塊12254,用于基于所述相關(guān)性系數(shù)的數(shù)值,確定至少一個(gè)候選長(zhǎng)度范圍或者候選長(zhǎng)度范圍組合作為所述預(yù)定范圍。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述預(yù)定范圍是基于多個(gè)對(duì)照樣品確定的,其中,所述對(duì)照樣品中核酸濃度是已知的,優(yōu)選的,所述預(yù)定范圍是基于至少20個(gè)對(duì)照樣品確定的。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述對(duì)照樣品為已知游離胎兒核酸比例的懷有正常男胎的孕婦外周血樣本,并且所述對(duì)照樣品中游離胎兒核酸濃度是利用Y染色體確定的。也即通過(guò)本發(fā)明上述男性胎兒核酸濃度f(wàn)y的方法確定的。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述候選長(zhǎng)度范圍的跨度為1~300bp,優(yōu)選的為1~20bp。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述多個(gè)候選長(zhǎng)度范圍的步長(zhǎng)為1~2bp。例如,所述候選長(zhǎng)度范圍分別為1~20,2~21,3~22……,其中跨度為20bp,步長(zhǎng)為1bp。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述預(yù)定范圍為179bp-206bp。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述女性胎兒核酸濃度f(wàn)s獲得單元122進(jìn)一步包括預(yù)定函數(shù)確定元件1226,參見(jiàn)圖14,所述預(yù)定函數(shù)確定元件1226包括:第二頻率確定模塊12261,用于分別在所述多個(gè)對(duì)照樣品中,確定在所述預(yù)定范圍內(nèi)出現(xiàn)唯一比對(duì)測(cè)序序列的頻率;擬合模塊12262,用于將所述多個(gè)對(duì)照樣品中在所述預(yù)定范圍內(nèi)出現(xiàn)唯一比對(duì)測(cè)序序列的頻率與已知的核酸濃度進(jìn)行擬合,以便確定所述預(yù)定的函數(shù)。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述擬合為線性擬合。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述預(yù)定函數(shù)為d=-0.3215×p+1.62562,其中,d表示游離胎兒核酸濃度,p表示在所述預(yù)定范圍內(nèi)出現(xiàn)唯一比對(duì)測(cè)序序列的頻率。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述第一過(guò)濾裝置140還包括假陽(yáng)性判斷單元141,用于若根據(jù)所述缺失的拷貝數(shù)計(jì)算得到rmY≧2或所述重復(fù)的拷貝數(shù)計(jì)算得到rmY≧6,則判定為不可信,過(guò)濾掉假陽(yáng)性結(jié)果;或者,若根據(jù)所述缺失的拷貝數(shù)計(jì)算得到rms≧2或所述重復(fù)的拷貝數(shù)計(jì)算得到rms≧6,則判定為不可信,過(guò)濾掉假陽(yáng)性結(jié)果。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述第二過(guò)濾裝置150還包括陽(yáng)性判斷單元151,用于判斷若dmY<0.13或dmY>0.85,則dmY為陽(yáng)性;或者,若dms<0.15或dms>0.791,則dms為陽(yáng)性。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述第三過(guò)濾裝置170中的判定原則為:若amY在0.95~1.05之間,則認(rèn)為所述微缺失微重復(fù)的片段來(lái)自于母親,過(guò)濾所述微缺失微重復(fù)的片段;或者,若ams在0.93~1.06之間,則認(rèn)為所述微缺失微重復(fù)的片段來(lái)自于母親,過(guò)濾所述微缺失微重復(fù)的片段。實(shí)施例1一、獲得微缺失微重復(fù)的片段的濃度f(wàn)m;1、對(duì)含有游離核酸的生物樣本進(jìn)行核酸測(cè)序,以便獲得由多個(gè)測(cè)序數(shù)據(jù)構(gòu)成的測(cè)序結(jié)果;2、將所述測(cè)序結(jié)果與參考基因組進(jìn)行比對(duì),以便構(gòu)建唯一比對(duì)測(cè)序序列集,所述唯一比對(duì)測(cè)序序列集中的每一個(gè)測(cè)序序列僅能夠與所述參考基因組的一個(gè)位置匹配;3、確定所述唯一比對(duì)測(cè)序序列集中各唯一比對(duì)測(cè)序序列的長(zhǎng)度;4、按照預(yù)定長(zhǎng)度將參考基因組劃分為多個(gè)初級(jí)窗口,所述預(yù)定長(zhǎng)度為1bp~5M,優(yōu)選的采用20kp~40kp為一個(gè)預(yù)定長(zhǎng)度,例如(1~20bp,20~40bp,40~80bp,80~100bp,100~120bp,……,);5、統(tǒng)計(jì)所述各唯一比對(duì)測(cè)序序列的長(zhǎng)度落入各個(gè)初級(jí)窗口的唯一比對(duì)測(cè)序序列的數(shù)目;6、對(duì)落入初級(jí)窗口中的序列數(shù)進(jìn)行GC修正,以及對(duì)修正后的結(jié)果進(jìn)行批次間調(diào)整,所述GC修正的方法包括采用局部加權(quán)回歸法,線性回歸法或邏輯回歸法;7、將預(yù)定數(shù)目個(gè)相鄰的初級(jí)窗口合并為多個(gè)次級(jí)窗口,確定各個(gè)次級(jí)窗口中的序列數(shù)目,所述預(yù)定數(shù)目為5~100個(gè);例如以5個(gè)初級(jí)窗口合并為1個(gè)次級(jí)窗口,5個(gè)初級(jí)窗口分別為1~20bp,20~40bp,40~80bp,80~100bp,100~120bp,合并后的次級(jí)窗口為1~120bp。8、對(duì)各個(gè)次級(jí)窗口進(jìn)行統(tǒng)計(jì)檢驗(yàn),計(jì)算出T1值,所述T1值包括Z檢驗(yàn)或T檢驗(yàn)計(jì)算得到;9、根據(jù)所述T1值過(guò)濾所述次級(jí)窗口,即將T1值在-3~3之間的次級(jí)窗口過(guò)濾掉;10、對(duì)過(guò)濾后的次級(jí)窗口進(jìn)行統(tǒng)計(jì)檢驗(yàn),計(jì)算出T2值,所述T2值包括但不限于根據(jù)秩和檢驗(yàn)、符號(hào)檢驗(yàn)或游程檢驗(yàn)計(jì)算得到;11、根據(jù)T2值將相鄰兩個(gè)無(wú)顯著性差異的次級(jí)窗口合并為終極窗口,所述無(wú)顯著性差異為兩個(gè)窗口的T2在-3~3之間;12、重復(fù)8-10,直至無(wú)法合并;13、將最終合并得到的終極窗口進(jìn)行假設(shè)檢驗(yàn),獲得含有微缺失微重復(fù)的終極窗口,所述假設(shè)檢驗(yàn)包括根據(jù)Z檢驗(yàn)或T檢驗(yàn)計(jì)算得到,即當(dāng)檢驗(yàn)的統(tǒng)計(jì)量>3或者<-3,判定為含有微缺失微重復(fù)的終極窗口。14、根據(jù)含有微缺失微重復(fù)的初級(jí)窗口,獲得不含微缺失微重復(fù)的初級(jí)窗口,計(jì)算含有微缺失微重復(fù)的初級(jí)窗口的總序列數(shù)和含有微缺失微重復(fù)的初級(jí)窗口的總數(shù)目,以及不含有微缺失微重復(fù)的初級(jí)窗口的總序列數(shù)和不含有微缺失微重復(fù)的初級(jí)窗口的總數(shù)目;15、計(jì)算含有微缺失微重復(fù)的終極窗口的平均深度d1,d1=含有微缺失微重復(fù)的初級(jí)窗口的總序列數(shù)/含有微缺失微重復(fù)的終極窗口的總數(shù)目;16、計(jì)算不含微缺失微重復(fù)的初級(jí)窗口的平均深度d2,d2=不含微缺失微重復(fù)的初級(jí)窗口的總序列數(shù)/不含微缺失微重復(fù)的初級(jí)窗口的總數(shù)目;17、計(jì)算微缺失微重復(fù)的片段的濃度f(wàn)m,fm=2×︱d2-d1︱/d2。二、獲得男性胎兒核酸濃度f(wàn)y或女性胎兒核酸濃度f(wàn)s;1、確定待測(cè)樣品中是否含有Y染色體,若含有,計(jì)算男性胎兒核酸濃度f(wàn)y,若不含有,計(jì)算女性胎兒核酸濃度f(wàn)s;2、若含有Y染色體,計(jì)算男性胎兒核酸濃度f(wàn)y。(1)根據(jù)上述測(cè)序結(jié)果確定所述樣品中的Y染色體中唯一比對(duì)測(cè)序序列落入初級(jí)窗口的數(shù)目;(2)去除初級(jí)窗口中經(jīng)GC修改調(diào)整后的唯一比對(duì)序列數(shù)目大于平均序列數(shù)目5倍以上的初級(jí)窗口;(3)統(tǒng)計(jì)Y染色體上各初級(jí)窗口中唯一比對(duì)測(cè)序序列的數(shù)目總和以及所述初級(jí)窗口的總數(shù)目;(4)獲得Y染色體中初級(jí)窗口的平均深度dy,dy=Y(jié)染色體上唯一比對(duì)測(cè)序序列數(shù)目總和/Y染色體上初級(jí)窗口的數(shù)目;(5)獲得男性胎兒核酸濃度f(wàn)y,fy=2×dy/d2,所述d2為不含微缺失微重復(fù)的初級(jí)窗口的平均深度,d2=不含微缺失微重復(fù)的初級(jí)窗口的總序列數(shù)/不含微缺失微重復(fù)的初級(jí)窗口的數(shù)目。3、若不含有Y染色體,計(jì)算女性胎兒核酸濃度f(wàn)s。(1)確定所述含有游離核酸的生物樣本中長(zhǎng)度落入預(yù)定范圍的唯一比對(duì)測(cè)序序列的數(shù)目;所述預(yù)定范圍為179bp-206bp。所述預(yù)定范圍通過(guò)如下步驟獲得:a、選出至少20個(gè)對(duì)照樣品,即包含已知的游離胎兒核酸濃度的樣品,本實(shí)施例采用男性胎兒對(duì)照樣品,所述對(duì)照樣品中游離胎兒核酸濃度根據(jù)Y染色體確定,也即通過(guò)上述男性胎兒核酸濃度f(wàn)y的方法確定的。b、統(tǒng)計(jì)出所有對(duì)照樣品中所包含的唯一比對(duì)測(cè)序序列的長(zhǎng)度,從0bp到Mbp(M表示核酸的最長(zhǎng)的長(zhǎng)度),并確定每個(gè)長(zhǎng)度下出現(xiàn)的唯一比對(duì)測(cè)序序列的序列數(shù);c、以某個(gè)長(zhǎng)度為候選長(zhǎng)度范圍,按照1~2bp的步長(zhǎng)挪動(dòng)劃分多個(gè)候選長(zhǎng)度范圍,例如1bp,2bp,3bp,…,100bp,…,300bp,統(tǒng)計(jì)出所述對(duì)照樣品在每個(gè)候選長(zhǎng)度范圍內(nèi)出現(xiàn)的唯一比對(duì)測(cè)序序列的頻率;d、找出所述多個(gè)對(duì)照樣品在各候選長(zhǎng)度范圍內(nèi)出現(xiàn)唯一比對(duì)測(cè)序序列的頻率與所述對(duì)照樣品中核酸的濃度相關(guān)性比較強(qiáng)的候選長(zhǎng)度范圍或范圍的組合,確定各所述候選長(zhǎng)度范圍與所述核酸的濃度的相關(guān)性系數(shù);其中,相關(guān)性系數(shù)通過(guò)相關(guān)性計(jì)算得到,包括線性回歸、邏輯回歸、局部加權(quán)等方法計(jì)算得到。其中,所述候選長(zhǎng)度范圍的跨度為1~300bp,優(yōu)選的為1~20bp。多個(gè)候選長(zhǎng)度范圍的步長(zhǎng)為1~2bp。e、基于所述相關(guān)性系數(shù)的數(shù)值,確定至少一個(gè)候選長(zhǎng)度范圍或者候選長(zhǎng)度范圍組合作為所述預(yù)定范圍。(2)基于所述長(zhǎng)度落入預(yù)定范圍的唯一比對(duì)測(cè)序序列的數(shù)目,統(tǒng)計(jì)出所述預(yù)定范圍內(nèi)出現(xiàn)唯一比對(duì)測(cè)序序列的頻率;(3)基于所述預(yù)定范圍內(nèi)的唯一比對(duì)測(cè)序序列的頻率,根據(jù)預(yù)定的函數(shù),確定所述樣本中女性胎兒核酸濃度f(wàn)s。所述預(yù)定函數(shù)通過(guò)如下步驟獲得:a、分別在所述多個(gè)對(duì)照樣品中,確定在所述預(yù)定范圍內(nèi)出現(xiàn)唯一比對(duì)測(cè)序序列的頻率,所述對(duì)照樣品中的預(yù)定范圍及唯一比對(duì)測(cè)序序列的頻率通過(guò)前述預(yù)定范圍確定方法得到;b、將所述多個(gè)對(duì)照樣品中在所述預(yù)定范圍內(nèi)出現(xiàn)唯一比對(duì)測(cè)序序列插入片段的頻率與已知的核酸濃度進(jìn)行線性擬合,以便確定所述預(yù)定的函數(shù)。優(yōu)選的,所述預(yù)定函數(shù)為d=-0.3215×p+1.62562,其中,d表示游離胎兒核酸濃度,p表示在所述預(yù)定范圍內(nèi)出現(xiàn)唯一比對(duì)測(cè)序序列的頻率。三、計(jì)算微缺失微重復(fù)的片段的濃度f(wàn)m與男性胎兒核酸濃度f(wàn)y的比值rmY=fm/fy,或計(jì)算含有微缺失微重復(fù)的片段的濃度f(wàn)m與女性胎兒核酸濃度f(wàn)s的比值rms=fm/fs;四、根據(jù)缺失的拷貝數(shù)計(jì)算得到rmY≧2或重復(fù)的拷貝數(shù)計(jì)算得到rmY≧6,則判定為不可信,過(guò)濾掉假陽(yáng)性結(jié)果;或者,若缺失的拷貝數(shù)計(jì)算得到rms≧2或重復(fù)的拷貝數(shù)計(jì)算得到rms≧6,則判定為不可信,過(guò)濾掉假陽(yáng)性結(jié)果;過(guò)濾假陽(yáng)性是為了去除多拷貝的影響,使結(jié)果更準(zhǔn)確。五、取rmY的小數(shù)部分dmY,或rms的小數(shù)部分dms,判斷dmY或dms是否為陽(yáng)性,否則過(guò)濾掉結(jié)果:若dmY<0.13或dmY>0.85,則dmY為陽(yáng)性;或者,若dms<0.15或dms>0.791,則dms為陽(yáng)性;六、計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與男性胎兒核酸濃度f(wàn)y的和為amY=fm+fy,或計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與女性胎兒核酸濃度f(wàn)s的和為ams=fm+fs;七、若amY在0.95~1.05之間,則認(rèn)為所述微缺失微重復(fù)的片段來(lái)自于母親,過(guò)濾所述微缺失微重復(fù)的片段;或者,若ams在0.93~1.06之間,則認(rèn)為所述微缺失微重復(fù)的片段來(lái)自于母親,過(guò)濾所述微缺失微重復(fù)的片段,過(guò)濾后得到胎兒染色體微缺失微重復(fù)片段。實(shí)施例21、樣品收集及處理選擇1個(gè)批次100個(gè)樣本,提取外周血2ml進(jìn)行血漿分離。2、文庫(kù)構(gòu)建可參照本領(lǐng)域人員熟知的血漿文庫(kù)構(gòu)建要求進(jìn)行文庫(kù)構(gòu)建3、測(cè)序測(cè)序過(guò)程可參照本領(lǐng)域人員熟知的測(cè)序流程進(jìn)行上機(jī)操作。4、數(shù)據(jù)分析通過(guò)雙末端測(cè)序得到測(cè)序結(jié)果,經(jīng)過(guò)以下分析得到初始的微缺失微重復(fù)的結(jié)果,步驟如下:4.1比對(duì),將測(cè)序結(jié)果比對(duì)到參考基因組上,確定唯一比對(duì)測(cè)序序列的位置。4.2按照20kb的長(zhǎng)度將參考基因組劃分為多個(gè)初級(jí)窗口,統(tǒng)計(jì)每個(gè)初級(jí)窗口內(nèi)的唯一比對(duì)測(cè)序序列數(shù)和GC含量,用局部加權(quán)回歸落入初級(jí)窗口中的序列數(shù)進(jìn)行GC修正。4.3對(duì)批次內(nèi)所有樣本,對(duì)每個(gè)初級(jí)窗口進(jìn)行基線的修正,批次間調(diào)整。4.4以100個(gè)為單位將相鄰的初級(jí)窗口進(jìn)行合并,合并后得到多個(gè)次級(jí)窗口,所述次級(jí)窗口的長(zhǎng)度為2M;4.5利用Z檢驗(yàn)計(jì)算各個(gè)次級(jí)窗口的T1值,將T1值在-3~3之間的次級(jí)窗口過(guò)濾掉;4.6對(duì)過(guò)濾后的次級(jí)窗口進(jìn)行游程檢驗(yàn)計(jì)算出T2值,根據(jù)T2值將相鄰兩個(gè)T2值在-3~3之間的次級(jí)窗口合并為終極窗口;4.7重復(fù)步驟4.5-4.6,直至無(wú)法合并;4.8根據(jù)Z檢驗(yàn)計(jì)算最終合并得到的終極窗口,計(jì)算得到微缺失微重復(fù)結(jié)果,共檢出19個(gè)樣本有微缺失微重復(fù)的結(jié)果。表119個(gè)樣本檢出的結(jié)果表1.表中說(shuō)明了19個(gè)樣本檢出的結(jié)果,其中第一列是樣本的id,第二列是發(fā)生微缺失微重復(fù)的染色體,第三列是染色體的微缺失微重復(fù)長(zhǎng)度,第四列是檢出的T值。4.9根據(jù)微缺失微重復(fù)的結(jié)果計(jì)算微缺失微重復(fù)片段的濃度,具體的步驟如下:計(jì)算每個(gè)樣本中含有微缺失微重復(fù)的初級(jí)窗口的平均深度d1;計(jì)算不含微缺失微重復(fù)的初級(jí)窗口的平均深度d2;計(jì)算微缺失微重復(fù)的片段的濃度f(wàn)m;計(jì)算胎兒核酸濃度。對(duì)以上19個(gè)結(jié)果的表格如下:表2.19個(gè)樣本的胎兒核酸濃度信息4.10根據(jù)chrY的比例計(jì)算胎兒濃度,得到其中8個(gè)樣本的男性胎兒濃度,具體的步驟如下:去除染色體chrY中經(jīng)GC修改調(diào)整后的唯一比對(duì)序列數(shù)目大于平均序列數(shù)目5倍以上的初級(jí)窗口;計(jì)算chrY中初級(jí)窗口的平均深度dy;計(jì)算男性胎兒核酸濃度f(wàn)y,結(jié)果如下表:表3.19個(gè)樣本由chrY估算的胎兒核酸濃度的結(jié)果4.11根據(jù)片段長(zhǎng)度計(jì)算胎兒的濃度,得到11個(gè)樣本的女性胎兒濃度,具體的步驟如下:統(tǒng)計(jì)出整個(gè)批次中共有41個(gè)男性樣本,找出頻率與胎兒濃度相關(guān)性較強(qiáng)的區(qū)域,這里選出的區(qū)域?yàn)?79bp-206bp,相關(guān)系數(shù)R=-0.9056996。確定剩余11個(gè)樣本中長(zhǎng)度范圍在179bp-206bp里的核酸唯一比對(duì)測(cè)序序列出現(xiàn)的頻率與游離的胎兒核酸濃度的函數(shù)關(guān)系,利用選出的區(qū)域179bp-206bp做線性擬合,得到關(guān)系式d=a×p+b,公式中d代表濃度,p代表出現(xiàn)的頻率,計(jì)算得到a,b分別為-0.3215和1.62562。根據(jù)擬合計(jì)算女性胎兒樣本的結(jié)果,得出的結(jié)果如下:表4.19個(gè)樣本根據(jù)片段長(zhǎng)度計(jì)算得到的胎兒核酸濃度4.12對(duì)微缺失微重復(fù)結(jié)果進(jìn)行篩選。對(duì)男性的胎兒:計(jì)算微缺失微重復(fù)的片段的濃度f(wàn)m與男性胎兒核酸濃度f(wàn)y的比值rmY=fm/fy;根據(jù)拷貝數(shù)進(jìn)行過(guò)濾,過(guò)濾缺失的拷貝數(shù)rmY值在2以上的片段,過(guò)濾重復(fù)的拷貝數(shù)rmY值在6以上的片段。對(duì)rmY取小數(shù)部分得到dmY。對(duì)剩余的片段,過(guò)濾dmY大于0.13并且小于0.85的片段。計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與男性胎兒核酸濃度f(wàn)y的和為amY=fm+fy;過(guò)濾amY>0.95并且amY<1.05的片段,得到男性胎兒含有微缺失微重復(fù)的樣本。對(duì)女性的胎兒:計(jì)算微缺失微重復(fù)的片段的濃度f(wàn)m與女性胎兒核酸濃度f(wàn)s的比值rms=fm/fs;根據(jù)拷貝數(shù)進(jìn)行過(guò)濾,過(guò)濾缺失的拷貝數(shù)rms值在2以上的片段,過(guò)濾重復(fù)的拷貝數(shù)rms值在6以上的片段。對(duì)rms取小數(shù)部分得到dms。對(duì)剩余的片段,過(guò)濾dms大于0.15并且小于0.791的片段。計(jì)算含有微缺失微重復(fù)片段的濃度f(wàn)m與女性胎兒核酸濃度f(wàn)s的和為ams=fm+fs;過(guò)濾ams>0.93并且ams<1.06的片段,得到女性胎兒含有微缺失微重復(fù)的樣本。得到陽(yáng)性的結(jié)果如下表5:表5.過(guò)濾后的微缺失微重復(fù)結(jié)果樣本8染色體起始位置19394465終止位置27194537微缺失微重復(fù)的長(zhǎng)度7.80MT值5.030微缺失微重復(fù)計(jì)算的濃度0.119863根據(jù)chrY計(jì)算得到的胎兒濃度根據(jù)片段長(zhǎng)度計(jì)算得到的胎兒濃度0.126509對(duì)微缺失微重復(fù)的結(jié)果經(jīng)過(guò)以上的處理,能夠過(guò)濾大量的假陽(yáng)性,得到準(zhǔn)確的結(jié)果,參見(jiàn)圖15。圖中橫坐標(biāo)表示樣本的編號(hào),縱坐標(biāo)表示濃度,其中fm表示微缺失微重復(fù)估算出來(lái)的濃度,fy表示男胎樣本根據(jù)chrY估算出來(lái)的濃度,fs表示女胎根據(jù)片段估算出來(lái)的濃度,可以看出,經(jīng)過(guò)以上標(biāo)準(zhǔn)的判斷,編號(hào)為28的樣本為最終含有微重復(fù)結(jié)果的胎兒樣本。實(shí)施3本實(shí)施例確定胎兒染色體中微缺失微重復(fù)的方法與實(shí)施例2相同,其不同之處在于,步驟4.2中按照40kb的窗口進(jìn)行劃分。實(shí)施4本實(shí)施例確定胎兒染色體中微缺失微重復(fù)的方法與實(shí)施例2相同,其不同之處在于,步驟4.4中以200個(gè)為單位進(jìn)行合并,合并后得到的次級(jí)窗口的長(zhǎng)度為4M。實(shí)施5本實(shí)施例確定胎兒染色體中微缺失微重復(fù)的方法與實(shí)施例2相同,其不同之處在于,步驟4.11中采用40個(gè)男性樣本,選出的區(qū)域?yàn)?85~204bp,相關(guān)系數(shù)R=-0.87。利用選出的區(qū)域185~204bp做線性擬合,得到關(guān)系式d=a×p+b,公式中d代表濃度,p代表出現(xiàn)的頻率,計(jì)算得到a,b分別為0.0334和1.6657。上面所述的實(shí)施例僅僅是對(duì)本發(fā)明的優(yōu)選實(shí)施方式進(jìn)行描述,并非對(duì)本發(fā)明的范圍進(jìn)行限定,在不脫離本發(fā)明設(shè)計(jì)精神的前提下,本領(lǐng)域普通工程技術(shù)人員對(duì)本發(fā)明技術(shù)方案所做出的各種變形和改進(jìn),均應(yīng)落入本發(fā)明的權(quán)利要求書(shū)確定的保護(hù)范圍內(nèi)。當(dāng)前第1頁(yè)1 2 3