1.一種多樣本拷貝數(shù)一致性變異區(qū)域的統(tǒng)計(jì)檢驗(yàn)方法,其特征在于,所述多樣本拷貝數(shù)一致性變異區(qū)域的統(tǒng)計(jì)檢驗(yàn)方法基于拷貝數(shù)位點(diǎn)的關(guān)系系數(shù)擬合成曲線,計(jì)算每個(gè)位點(diǎn)的導(dǎo)數(shù)值,通過假設(shè)檢驗(yàn)方法檢測顯著的導(dǎo)數(shù)值,從確定拷貝數(shù)斷點(diǎn),建立拷貝數(shù)變異候選區(qū)域;通過在全基因組及樣本兩個(gè)方向上隨機(jī)置換CNVs的方式構(gòu)建假設(shè)檢驗(yàn)零分布,檢測多樣本中拷貝數(shù)一致性變異區(qū)域。
2.如權(quán)利要求1所述的多樣本拷貝數(shù)一致性變異區(qū)域的統(tǒng)計(jì)檢驗(yàn)方法,其特征在于,所述構(gòu)造關(guān)系系數(shù)擬合成曲線之前需要進(jìn)行對(duì)測序數(shù)據(jù)文件的預(yù)處理,具體包括:
在對(duì)測序數(shù)據(jù)文件比對(duì)的基礎(chǔ)上,計(jì)算每個(gè)位點(diǎn)的讀段數(shù);依據(jù)樣本讀段數(shù)均值對(duì)讀段數(shù)進(jìn)行規(guī)整化,以獲得樣本間具有可比性的讀段數(shù)信號(hào),計(jì)算公式為:
其中,mean_RCn和mean_RC分別指第n個(gè)樣本的讀段數(shù)均值和多個(gè)樣本讀段數(shù)的均值,xnm指第n個(gè)樣本第m個(gè)位點(diǎn)的讀段數(shù),x'nm指相應(yīng)位點(diǎn)規(guī)整后的讀段數(shù)。
3.如權(quán)利要求2所述的多樣本拷貝數(shù)一致性變異區(qū)域的統(tǒng)計(jì)檢驗(yàn)方法,其特征在于,定義等長的bins,將樣本位點(diǎn)的讀段數(shù)轉(zhuǎn)化為以bin為單位的讀段數(shù),對(duì)拷貝數(shù)變異的檢測將以bin為單位元進(jìn)行。
4.如權(quán)利要求1所述的多樣本拷貝數(shù)一致性變異區(qū)域的統(tǒng)計(jì)檢驗(yàn)方法,其特征在于,基于預(yù)處理數(shù)據(jù)矩陣M,M中每一行表示一個(gè)樣本,每一列表示一個(gè)bin;采用Pearson相關(guān)分析方法計(jì)算bins之間的關(guān)系系數(shù),構(gòu)建該關(guān)系系數(shù)的擬合成曲線,求解每個(gè)bin的導(dǎo)數(shù)值。
5.如權(quán)利要求4所述的多樣本拷貝數(shù)一致性變異區(qū)域的統(tǒng)計(jì)檢驗(yàn)方法,其特征在于,以導(dǎo)數(shù)值為背景,建立假設(shè)檢驗(yàn)零分布,檢驗(yàn)顯著性的導(dǎo)數(shù)值,其顯著性意味著在該bin的位置中存在斷點(diǎn),獲得拷貝數(shù)變異候選區(qū)域。
6.如權(quán)利要求1所述的多樣本拷貝數(shù)一致性變異區(qū)域的統(tǒng)計(jì)檢驗(yàn)方法,其特征在于,拷貝數(shù)變異候選區(qū)域采用循環(huán)迭代過程檢測顯著的CNVs,具體包括:通過在全基因組中隨機(jī)置換CNV候選區(qū)域構(gòu)造假設(shè)檢驗(yàn)零分布,對(duì)CNV候選區(qū)域進(jìn)行檢驗(yàn),若發(fā)現(xiàn)顯著性的CNV,便將其從基因組中去除,重新構(gòu)造假設(shè)檢驗(yàn)零分布并重新檢驗(yàn)CNV候選區(qū)域,直到?jīng)]有發(fā)現(xiàn)新的CNVs為止。
7.如權(quán)利要求1所述的多樣本拷貝數(shù)一致性變異區(qū)域的統(tǒng)計(jì)檢驗(yàn)方法,其特征在于,檢測多樣本拷貝數(shù)一致性變異區(qū)域包括:通過在全基因組及樣本中隨機(jī)置換CNVs以構(gòu)造置換數(shù)據(jù)矩陣Mt,計(jì)算隨機(jī)CNVs在多樣本中發(fā)生的頻率f;重復(fù)該過程n次,n>1000,獲得一個(gè)頻率f的分布,即假設(shè)檢驗(yàn)零分布;對(duì)置換前數(shù)據(jù)矩陣的CNVs頻率進(jìn)行檢驗(yàn),計(jì)算每個(gè)CNV的p值,根據(jù)顯著性水平閾值確定多樣本一致性變異的CNVs。
8.一種應(yīng)用權(quán)利要求1~7任意一項(xiàng)所述多樣本拷貝數(shù)一致性變異區(qū)域的統(tǒng)計(jì)檢驗(yàn)方法的癌癥基因。
9.一種應(yīng)用權(quán)利要求1~7任意一項(xiàng)所述多樣本拷貝數(shù)一致性變異區(qū)域的統(tǒng)計(jì)檢驗(yàn)方法的癌細(xì)胞分子。