一種用于檢測(cè)循環(huán)腫瘤DNA樣本基因融合的裝置的制作方法

文檔序號(hào)：12669619閱讀：497來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及基因融合檢測(cè)領(lǐng)域，尤其涉及一種用于檢測(cè)循環(huán)腫瘤DNA樣本基因融合的裝置及方法。

背景技術(shù)：

腫瘤細(xì)胞會(huì)向血液中釋放基因組DNA，這些變異DNA也隨之釋放到外周血中，被稱(chēng)為循環(huán)腫瘤DNA(circulating tumor DNA，ctDNA)。有文獻(xiàn)報(bào)道稱(chēng)，癌變?nèi)巳貉獫{中游離100～400bp大小的DNA片段濃度明顯高于正常人，可以作為篩查的標(biāo)志物。又有研究發(fā)現(xiàn)，循環(huán)腫瘤DNA在早期原位癌(primary cancer)患者血液中就已經(jīng)開(kāi)始出現(xiàn)。由于外周血循環(huán)DNA半衰期短，因此循環(huán)腫瘤DNA能夠真實(shí)反映患者病變組織基因突變的真實(shí)情況。循環(huán)腫瘤DNA在惡性腫瘤診療中的應(yīng)用越來(lái)越受到關(guān)注和重視，作為研究的熱點(diǎn)和突破口將有可能為臨床腫瘤的早期診斷、預(yù)后判定及療效監(jiān)測(cè)等提供一系列方便、快捷、特異、無(wú)創(chuàng)的分子生物學(xué)檢測(cè)手段。

融合基因(Fusion gene)是指兩個(gè)基因的全部或一部分序列相互融合為一個(gè)新的基因的過(guò)程，通常具有致癌性，在各種不同的腫瘤中普遍存在。1973年，芝加哥大學(xué)的Jane Rowley在血液病中發(fā)現(xiàn)了第一個(gè)融合基因。隨后，在諸多實(shí)體瘤如肺癌、乳腺癌、前列腺癌、卵巢癌等中相繼發(fā)現(xiàn)了融合基因的存在。目前越來(lái)越多的融合基因在不同腫瘤中被報(bào)道?；蛉诤鲜且活?lèi)在臨床上非常重要的染色體結(jié)構(gòu)變異，在癌癥發(fā)生發(fā)展過(guò)程中起著關(guān)鍵的作用。精準(zhǔn)的融合基因檢測(cè)結(jié)果可以為臨床抗癌靶點(diǎn)用藥治療和預(yù)后評(píng)估提供參考依據(jù)。

傳統(tǒng)上用于檢測(cè)融合基因的檢測(cè)技術(shù)主要基于遺傳學(xué)方法，如FISH。然而，相對(duì)較低的分辨率和通量限制了該種方法在復(fù)雜的上皮組織癌的檢測(cè)中的應(yīng)用。

隨著二代測(cè)序技術(shù)的發(fā)展，涌現(xiàn)了大量用于檢測(cè)融合基因的檢測(cè)方法?；蛉诤蠙z測(cè)方法中，斷點(diǎn)的確認(rèn)直接影響到檢測(cè)結(jié)果的判定。CREST是當(dāng)前檢測(cè)Fusion gene的主流算法之一，該算法利用組裝算法實(shí)現(xiàn)兩次組裝，從而排除假陽(yáng)性，因此其主要優(yōu)點(diǎn)是假陽(yáng)性低，但同時(shí)由于需要進(jìn)行兩次組裝，導(dǎo)致存在檢測(cè)速度慢、資源要求高、需要進(jìn)行組裝等缺點(diǎn)；同時(shí)，組裝效果還會(huì)受到覆蓋度、插入片段長(zhǎng)度的影響。血漿中游離DNA含量極微，片段化嚴(yán)重，且循環(huán)腫瘤DNA僅占血漿游離DNA總量的0.02％-50％，加之ctDNA的釋放量會(huì)受到患者病情，癌種，分期，用藥情況等各類(lèi)綜合因素的影響，使得ctDNA樣本的覆蓋度降低，導(dǎo)致這一問(wèn)題在腫瘤循環(huán)DNA樣本中表現(xiàn)尤為明顯，從而影響融合檢測(cè)結(jié)果。因此，如何應(yīng)對(duì)融合基因檢測(cè)過(guò)程中檢測(cè)速度慢、系統(tǒng)資源要求高、需要進(jìn)行組裝的問(wèn)題，特別是低覆蓋度樣本的檢測(cè)成為本領(lǐng)域面臨的一大難題。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明所要解決的技術(shù)問(wèn)題

現(xiàn)有技術(shù)算法由于需要進(jìn)行兩次組裝和三次比對(duì)，導(dǎo)致存在檢測(cè)速度慢、資源要求高等不足之處，同時(shí)由于循環(huán)腫瘤DNA樣本的組裝序列均較短且覆蓋度較低，對(duì)于重復(fù)序列的組裝存在一定的不確定性，可能會(huì)導(dǎo)致檢測(cè)結(jié)果錯(cuò)誤。

鑒于上述現(xiàn)有技術(shù)中存在的問(wèn)題，本發(fā)明的目的在于提供一種用于檢測(cè)基因融合的裝置及方法，其具有檢測(cè)速度快、資源要求低、穩(wěn)定性高的優(yōu)點(diǎn)。

與現(xiàn)有技術(shù)算法相比，本發(fā)明的檢測(cè)裝置充分利用了PE測(cè)序下機(jī)測(cè)序片段(reads)的信息，減少了比對(duì)次數(shù)，只需要兩次比對(duì)，而且不需要組裝，提高了檢測(cè)的穩(wěn)定性。

即，本發(fā)明包括：

一種用于檢測(cè)循環(huán)腫瘤DNA樣本基因融合的裝置，其包括以下模塊：

測(cè)序數(shù)據(jù)獲取模塊，用于獲取循環(huán)腫瘤DNA樣本的測(cè)序數(shù)據(jù)；優(yōu)選地，所述測(cè)序數(shù)據(jù)是采用雙端測(cè)序(Paired-end Sequencing，PE測(cè)序)方法獲得的測(cè)序數(shù)據(jù)；

比對(duì)模塊：其與所述測(cè)序數(shù)據(jù)獲取模塊相連接，用于將獲取的測(cè)序數(shù)據(jù)與參考序列進(jìn)行比對(duì)，獲取比對(duì)結(jié)果。所述比對(duì)結(jié)果包括測(cè)序片段在基因中對(duì)應(yīng)的位置信息。所述位置信息包括軟剪切信息和成功比對(duì)信息。所述測(cè)序片段中帶有軟剪切信息的部分為所述測(cè)序片段的軟剪切部，所述測(cè)序片段中帶有成功比對(duì)信息的部分為所述測(cè)序片段的成功比對(duì)部。優(yōu)選地，該模塊可以利用bwa軟件，查找測(cè)序片段在基因中對(duì)應(yīng)的位置，并形成bam格式文件；優(yōu)選地，該bam文件中，包括每條測(cè)序片段的描述信息(qname)，序列信息(seq)，比對(duì)位置(POS),位標(biāo)識(shí)(flag),比對(duì)質(zhì)量值(MAPQ),簡(jiǎn)要比對(duì)表達(dá)信息(Cigar)，模板長(zhǎng)度(Tlen)；

再比對(duì)模塊：其與所述比對(duì)模塊相連接，用于將帶有軟剪切信息的測(cè)序片段與參考基因組再次比對(duì)，獲取再比對(duì)結(jié)果；

真實(shí)融合斷點(diǎn)判斷模塊：其與所述再比對(duì)模塊相連接，用于判斷所述測(cè)序片段的融合斷點(diǎn)；以及

輸出模塊：其與所述真實(shí)融合斷點(diǎn)判斷模塊相連接，用于輸出基因融合檢測(cè)結(jié)果，例如，基因融合斷點(diǎn)位置(如left_pos，right_pos)，染色體編號(hào)(如left_chr，right_chr)，支持度(如sup)等。

優(yōu)選地，所述再比對(duì)模塊例如可以包括以下子模塊：

長(zhǎng)度過(guò)濾子模塊：其與所述比對(duì)模塊相連接，用于過(guò)濾去除含有軟剪切(soft-clipping)信息的測(cè)序片段中長(zhǎng)度小于一定值的測(cè)序片段；優(yōu)選地，所述一定值可以是例如15～30bp，優(yōu)選20～25bp。

斷點(diǎn)判斷子模塊：其與所述長(zhǎng)度過(guò)濾子模塊相連接，用于根據(jù)所述長(zhǎng)度過(guò)濾子模塊的結(jié)果數(shù)據(jù)，將測(cè)序片段中帶有軟剪切信息的部分與帶有正常比對(duì)信息的部分的結(jié)合處作為斷點(diǎn)；

區(qū)分子模塊：其與所述斷點(diǎn)判斷子模塊相連接，用于將所述帶有軟剪切信息的部分和所述帶有正常比對(duì)信息的部分在斷點(diǎn)處分開(kāi)，并將這兩部分的序列信息分別保存至兩個(gè)文件(例如fastq文件)中；

再比對(duì)子模塊：其與所述區(qū)分子模塊相連接，用于對(duì)所述分別保存了序列信息的兩個(gè)文件與參考序列再次進(jìn)行比對(duì)，獲取再比對(duì)結(jié)果；優(yōu)選地，所述再比對(duì)結(jié)果包括下述信息：每條測(cè)序片段的描述信息(qname)、序列信息(seq)、比對(duì)位置(POS)、位標(biāo)識(shí)(flag),比對(duì)質(zhì)量值(MAPQ)，簡(jiǎn)要比對(duì)表達(dá)信息(Cigar)，模板長(zhǎng)度(Tlen)。優(yōu)選地，例如可以利用bwa軟件對(duì)上述兩個(gè)fastq文件，再次進(jìn)行比對(duì)，形成bam格式文件。所述bam格式文件包含每條測(cè)序片段的描述信息(qname)，序列信息(seq)、位標(biāo)識(shí)(flag),比對(duì)位置(POS),比對(duì)質(zhì)量值(MAPQ),簡(jiǎn)要比對(duì)表達(dá)信息(Cigar)，模板長(zhǎng)度(Tlen)。

優(yōu)選地，所述真實(shí)融合斷點(diǎn)判斷模塊可以包括下述子模塊：過(guò)濾子模塊：其與所述再比對(duì)子模塊相連接，用于根據(jù)位標(biāo)識(shí)(flag)值過(guò)濾去除未成功比對(duì)(unmapped)的測(cè)序片段以及低比對(duì)質(zhì)量值(MAPQ)的測(cè)序片段；

斷點(diǎn)信息獲取子模塊：其與所述過(guò)濾子模塊相連接，用于查找具有相同片段描述信息(qname)的測(cè)序片段，并獲取斷點(diǎn)信息；優(yōu)選地，斷點(diǎn)信息包括：(1)Left/right_chr，斷點(diǎn)左/右側(cè)序列的染色體編號(hào)；(2)left/right_pos，斷點(diǎn)左/右側(cè)首個(gè)堿基的比對(duì)位置；(3)left/right_seq，斷點(diǎn)左/右側(cè)堿基的序列；(4)sup，斷點(diǎn)支持度，支持該斷點(diǎn)的測(cè)序片段個(gè)數(shù)。

融合斷點(diǎn)篩選子模塊：其與所述斷點(diǎn)信息獲取子模塊相連接，用于在斷點(diǎn)信息中篩選融合斷點(diǎn)；

融合斷點(diǎn)初次合并子模塊：其與所述融合斷點(diǎn)篩選子模塊相連接，用于將具有相同的斷點(diǎn)信息的融合斷點(diǎn)合并為一個(gè)真實(shí)融合斷點(diǎn)，并將具有相同斷點(diǎn)信息的融合斷點(diǎn)個(gè)數(shù)作為真實(shí)融合斷點(diǎn)的支持度。其中，相同的斷點(diǎn)信息是指left_chr、left_pos、right_chr和right_pos均相同。

融合斷點(diǎn)再次合并子模塊：其與所述斷點(diǎn)初次合并子模塊相連接，用于將left_chr和right_chr相同，right_pos或left_pos相差一定值(例如3bp)以內(nèi)的融合斷點(diǎn)合并為一個(gè)真實(shí)融合斷點(diǎn)。

優(yōu)選地，所述斷點(diǎn)信息包括：

left_chr：斷點(diǎn)左側(cè)序列的染色體編號(hào)，read1對(duì)應(yīng)的參考序列編號(hào)。

left_pos:斷點(diǎn)左側(cè)首個(gè)堿基的比對(duì)位置，read1對(duì)應(yīng)的比對(duì)位置加上read1的序列長(zhǎng)度。

left_seq：斷點(diǎn)左側(cè)堿基的序列。

right_chr：斷點(diǎn)右側(cè)序列的染色體編號(hào)，read2對(duì)應(yīng)的參考序列編號(hào)。

right_pos：斷點(diǎn)右側(cè)首個(gè)堿基的比對(duì)位置，read2對(duì)應(yīng)的比對(duì)位置加上read2的序列長(zhǎng)度。

right_seq：斷點(diǎn)右側(cè)堿基的序列。

sup：斷點(diǎn)支持度，支持該斷點(diǎn)的測(cè)序片段的個(gè)數(shù)，默認(rèn)為1。

此外，斷點(diǎn)信息還可以包括，ort：根據(jù)測(cè)序片段中片段描述信息中的比對(duì)結(jié)果模式判斷所得，“+”表示clean測(cè)序片段中斷點(diǎn)右側(cè)發(fā)生軟剪切，“-”表示clean測(cè)序片段中斷點(diǎn)左側(cè)發(fā)生軟剪切。

優(yōu)選地，所述融合斷點(diǎn)篩選子模塊包括如下元件：

斷點(diǎn)質(zhì)量過(guò)濾元件：用于過(guò)濾低質(zhì)量斷點(diǎn)，若存在斷點(diǎn)A，A中sup個(gè)數(shù)大于一定值(例如5)，且left_seq和right_seq中比對(duì)質(zhì)量值均大于一定值(例如30)，且錯(cuò)配率均小于一定值(例如0.05)或/和斷點(diǎn)支持度/斷點(diǎn)右側(cè)或左側(cè)位置深度大于一定值(例如0.1)，則該斷點(diǎn)A為融合斷點(diǎn)。

相同斷點(diǎn)合并元件：用于合并相同斷點(diǎn)，若存在斷點(diǎn)A和B，A中l(wèi)eft_chr等于B中right_chr，A中right_chr等于B中l(wèi)eft_chr，A中l(wèi)eft_pos等于B中right_pos，A中right_pos等于B中l(wèi)eft_pos，則將斷點(diǎn)A和B合并為一個(gè)融合斷點(diǎn)；

優(yōu)選地，所述融合斷點(diǎn)再次合并子模塊根據(jù)上述融合斷點(diǎn)信息，若存在融合斷點(diǎn)A中right_pos與融合斷點(diǎn)B中right_pos小于一定值(例如5)，且融合斷點(diǎn)A中l(wèi)eft_pos與融合斷點(diǎn)B中l(wèi)eft_pos小于一定值(例如5)，則將此融合斷點(diǎn)A和融合斷點(diǎn)B合并為一個(gè)真實(shí)融合斷點(diǎn)。從而最終得到基因融合(gene fusion)檢測(cè)結(jié)果。

此外，本發(fā)明還包括：

一種用于檢測(cè)循環(huán)腫瘤DNA樣本基因融合的方法，其包括以下步驟：

測(cè)序數(shù)據(jù)獲取步驟，獲取FFPE樣本的測(cè)序數(shù)據(jù)；優(yōu)選地，所述測(cè)序數(shù)據(jù)是采用雙端測(cè)序(Paired-end Sequencing，PE測(cè)序)方法獲得的測(cè)序數(shù)據(jù)；

比對(duì)步驟：將獲取的測(cè)序數(shù)據(jù)與參考序列進(jìn)行比對(duì)，獲取比對(duì)結(jié)果。所述比對(duì)結(jié)果包括測(cè)序片段在基因中對(duì)應(yīng)的位置信息。所述位置信息包括軟剪切信息和成功比對(duì)信息。所述測(cè)序片段中帶有軟剪切信息的部分為所述測(cè)序片段的軟剪切部，所述測(cè)序片段中帶有成功比對(duì)信息的部分為所述測(cè)序片段的成功比對(duì)部。優(yōu)選地，該模塊可以利用bwa軟件，查找測(cè)序片段在基因中對(duì)應(yīng)的位置，并形成bam格式文件；優(yōu)選地，該bam文件中，包括每條測(cè)序片段的描述信息(qname)，序列信息(seq)，比對(duì)位置(POS),位標(biāo)識(shí)(flag),比對(duì)質(zhì)量值(MAPQ),簡(jiǎn)要比對(duì)表達(dá)信息(Cigar)，模板長(zhǎng)度(Tlen)；

再比對(duì)步驟：將帶有軟剪切信息的測(cè)序片段與參考基因組再次比對(duì)，獲取再比對(duì)結(jié)果；

真實(shí)融合斷點(diǎn)判斷步驟：判斷所述測(cè)序片段的融合斷點(diǎn)；以及

輸出步驟：輸出基因融合檢測(cè)結(jié)果，例如，斷點(diǎn)位置(如left_pos，right_pos)，染色體編號(hào)(如left_chr，right_chr)，支持度(如sup)等。

優(yōu)選地，所述再比對(duì)步驟例如可以包括以下子步驟：

長(zhǎng)度過(guò)濾子步驟：過(guò)濾去除含有軟剪切(soft-clipping)信息的測(cè)序片段中長(zhǎng)度小于一定值的測(cè)序片段；優(yōu)選地，所述一定值可以是例如15～30bp，優(yōu)選20～25bp。

斷點(diǎn)判斷子步驟：根據(jù)所述長(zhǎng)度過(guò)濾子模塊的結(jié)果數(shù)據(jù)，將測(cè)序片段中帶有軟剪切信息的部分與帶有正常比對(duì)信息的部分的結(jié)合處作為斷點(diǎn)；

區(qū)分子步驟：將所述帶有軟剪切信息的部分和所述帶有正常比對(duì)信息的部分在斷點(diǎn)處分開(kāi)，并將這兩部分的序列信息分別保存至兩個(gè)文件(例如fastq文件)中；

再比對(duì)子步驟：對(duì)所述分別保存了序列信息的兩個(gè)文件與參考序列再次進(jìn)行比對(duì)，獲取再比對(duì)結(jié)果；優(yōu)選地，所述再比對(duì)結(jié)果包括下述信息：每條測(cè)序片段的描述信息(qname)、序列信息(seq)、比對(duì)位置(POS)、位標(biāo)識(shí)(flag),比對(duì)質(zhì)量值(MAPQ)，簡(jiǎn)要比對(duì)表達(dá)信息(Cigar)，模板長(zhǎng)度(Tlen)。優(yōu)選地，例如可以利用bwa軟件對(duì)上述兩個(gè)fastq文件，再次進(jìn)行比對(duì)，形成bam格式文件。所述bam格式文件包含每條測(cè)序片段的描述信息(qname)，序列信息(seq)、位標(biāo)識(shí)(flag),比對(duì)位置(POS),比對(duì)質(zhì)量值(MAPQ),簡(jiǎn)要比對(duì)表達(dá)信息(Cigar)，模板長(zhǎng)度(Tlen)。

優(yōu)選地，所述真實(shí)融合斷點(diǎn)判斷步驟可以包括下述子步驟：過(guò)濾子步驟：根據(jù)位標(biāo)識(shí)(flag)值過(guò)濾去除未成功比對(duì)(unmapped)的測(cè)序片段以及低比對(duì)質(zhì)量值(MAPQ)的測(cè)序片段；

斷點(diǎn)信息獲取子步驟：查找具有相同片段描述信息(qname)的測(cè)序片段，并獲取斷點(diǎn)信息；優(yōu)選地，斷點(diǎn)信息包括：(1)Left/right_chr，斷點(diǎn)左/右側(cè)序列的染色體編號(hào)；(2)left/right_pos，斷點(diǎn)左/右側(cè)首個(gè)堿基的比對(duì)位置；(3)left/right_seq，斷點(diǎn)左/右側(cè)堿基的序列；(4)sup，斷點(diǎn)支持度，支持該斷點(diǎn)的測(cè)序片段個(gè)數(shù)。

融合斷點(diǎn)篩選子步驟：在斷點(diǎn)信息中篩選融合斷點(diǎn)；

融合斷點(diǎn)初次合并子步驟：將具有相同的斷點(diǎn)信息的融合斷點(diǎn)合并為一個(gè)真實(shí)融合斷點(diǎn)，并將具有相同斷點(diǎn)信息的融合斷點(diǎn)個(gè)數(shù)作為真實(shí)融合斷點(diǎn)的支持度。其中，相同的斷點(diǎn)信息是指left_chr、left_pos、right_chr和right_pos均相同。

融合斷點(diǎn)再次合并子步驟：將left_chr和right_chr相同，right_pos或left_pos相差一定值(例如3bp)以內(nèi)的融合斷點(diǎn)合并為一個(gè)真實(shí)融合斷點(diǎn)。

優(yōu)選地，所述斷點(diǎn)信息包括：

left_chr：斷點(diǎn)左側(cè)序列的染色體編號(hào)，read1對(duì)應(yīng)的參考序列編號(hào)。

left_pos:斷點(diǎn)左側(cè)首個(gè)堿基的比對(duì)位置，read1對(duì)應(yīng)的比對(duì)位置加上read1的序列長(zhǎng)度。

left_seq：斷點(diǎn)左側(cè)堿基的序列。

right_chr：斷點(diǎn)右側(cè)序列的染色體編號(hào)，read2對(duì)應(yīng)的參考序列編號(hào)。

right_pos：斷點(diǎn)右側(cè)首個(gè)堿基的比對(duì)位置，read2對(duì)應(yīng)的比對(duì)位置加上read2的序列長(zhǎng)度。

right_seq：斷點(diǎn)右側(cè)堿基的序列。

sup：斷點(diǎn)支持度，支持該斷點(diǎn)的測(cè)序片段的個(gè)數(shù)，默認(rèn)為1。

優(yōu)選地，所述斷點(diǎn)篩選子模塊包括如下步驟：

若存在斷點(diǎn)A，A中sup個(gè)數(shù)大于一定值(例如5)，且left_seq和right_seq中比對(duì)質(zhì)量值均大于一定值(例如30)，且錯(cuò)配率均小于一定值(例如0.05)或/和斷點(diǎn)支持度/斷點(diǎn)右側(cè)或左側(cè)位置深度大于一定值(例如0.1)，則判斷該斷點(diǎn)A為融合斷點(diǎn)。

若存在斷點(diǎn)A和B，A中l(wèi)eft_chr等于B中right_chr，A中right_chr等于B中l(wèi)eft_chr，A中l(wèi)eft_pos等于B中right_pos，A中right_pos等于B中l(wèi)eft_pos，則將斷點(diǎn)A和B合并為一個(gè)融合斷點(diǎn)。

優(yōu)選地，所述融合斷點(diǎn)再次合并子步驟根據(jù)上述融合斷點(diǎn)信息，若存在融合斷點(diǎn)A中right_pos與融合斷點(diǎn)B中right_pos小于一定值(例如5)，且融合斷點(diǎn)A中l(wèi)eft_pos與融合斷點(diǎn)B中l(wèi)eft_pos小于一定值(例如5)，則將此融合斷點(diǎn)A和融合斷點(diǎn)B合并為一個(gè)真實(shí)融合斷點(diǎn)，從而最終得到基因融合(gene fusion)檢測(cè)結(jié)果。

根據(jù)本發(fā)明，能夠提供一種檢測(cè)速度快、資源要求低、穩(wěn)定性高的用于循環(huán)腫瘤DNA樣本檢測(cè)基因融合的裝置及方法?，F(xiàn)有算法的第二次和第三次比對(duì)過(guò)程中，每次只比對(duì)一條序列，長(zhǎng)時(shí)間占用系統(tǒng)資源。與現(xiàn)有算法相比，本發(fā)明發(fā)生算法充分利用了PE測(cè)序的優(yōu)勢(shì)，減少比對(duì)次數(shù)僅采用兩次比對(duì)。第一次比對(duì)時(shí)即過(guò)濾得到所有可能發(fā)生融合的片段(含有軟剪切信息的測(cè)序片段)；第二次比對(duì)是同時(shí)對(duì)所有序列進(jìn)行比對(duì)，提高了系統(tǒng)資源的利用率。此外，本發(fā)明算法不需要對(duì)序列進(jìn)行組裝，沒(méi)有組裝導(dǎo)致的不穩(wěn)定性，從而實(shí)現(xiàn)了對(duì)循環(huán)腫瘤DNA樣本的基因融合檢測(cè)。

附圖說(shuō)明

圖1是實(shí)施例1的用于檢測(cè)循環(huán)腫瘤DNA樣本基因融合的的示意圖。

圖2現(xiàn)有技術(shù)的用于檢測(cè)基因融合的裝置的一例的示意圖。

發(fā)明的具體實(shí)施方式

本說(shuō)明書(shū)中提及的科技術(shù)語(yǔ)具有與本領(lǐng)域技術(shù)人員通常理解的含義相同的含義，如有沖突以本說(shuō)明書(shū)中的定義為準(zhǔn)。

一般而言，本說(shuō)明書(shū)中采用的術(shù)語(yǔ)具有如下含義。

參考序列(Refseq):物種參考標(biāo)準(zhǔn)基因組序列。

融合基因(Fusion gene):是指兩個(gè)基因的全部或一部分的序列相互融合為一個(gè)新的基因的過(guò)程。其有可能是染色體易位、中間缺失或染色體導(dǎo)致所致的結(jié)果。

Reads:基因組或轉(zhuǎn)錄組序列片段。

PE測(cè)序：雙端測(cè)序，一種測(cè)序方法。

read1/2：PE測(cè)序下機(jī)數(shù)據(jù)中，read1是第一輪測(cè)試得到的堿基序列，read2是第二輪測(cè)試得到的堿基序列。

bwa：一種比對(duì)方法軟件，用于查找reads所在Refseq中的位置,最終可得到bam格式文件。

adapter序列:測(cè)序中DNA片段兩側(cè)的接頭序列。

斷點(diǎn)(breakpoint)：融合基因中兩個(gè)基因序列相互連接的點(diǎn)。

soft-clipping reads：軟剪切序列片段，在reads進(jìn)行比對(duì)后，若存在部分序列比對(duì)到Refseq某位置，另一部分比對(duì)到Refseq另一位置或不能比對(duì)到Refseq，則該reads被稱(chēng)為soft-clipping reads。

flag：bam格式文件中，用于描述序列比對(duì)模式、方向等信息的一個(gè)值

cigar：簡(jiǎn)要比對(duì)信息表達(dá)式，其以參考序列為基礎(chǔ)，使用數(shù)據(jù)加字母表示比對(duì)結(jié)果。

unmapped reads:指reads未比對(duì)到Refseq中某一位置。

duplication：重復(fù)序列，指由PCR擴(kuò)增的序列。

片段描述信息：Qname，比對(duì)片段(template)的描述信息。

錯(cuò)配率:在比對(duì)過(guò)程中，可以容許reads與Refseq存在一定的差異，差異值與reads長(zhǎng)度之比對(duì)錯(cuò)配率。

比對(duì)質(zhì)量值：表示比對(duì)到錯(cuò)誤位置的可能性，值越高表示可能性越低。

實(shí)施例

以下給出實(shí)施例，對(duì)本發(fā)明進(jìn)行更具體的說(shuō)明，但本發(fā)明不限于這些實(shí)施例。

實(shí)施例1本發(fā)明的用于檢測(cè)循環(huán)腫瘤DNA基因融合的裝置

采用本發(fā)明的檢測(cè)循環(huán)腫瘤DNA樣本基因融合的裝置對(duì)一例肺癌患者的外周血樣本的基因融合情況進(jìn)行檢測(cè)。

1.1提取外周血樣本的cfDNA

采用MagMAX Cell-Free DNA Isolation Kit試劑盒(Life公司)提取血液cfDNA，得到提取的cfDNA，提取方法參照使用手冊(cè)。

1.2末端修復(fù)(End Repair)

(1)預(yù)先從-20℃保存的試劑盒中取出所需試劑，單個(gè)樣本配制量參見(jiàn)表1。

表1

(2)末端修復(fù)反應(yīng)：加入DNA樣本后將1.5mL離心管置于Thermomixer中20℃溫浴30分鐘。反應(yīng)結(jié)束后使用1.8×核酸純化磁珠回收純化反應(yīng)體系中的DNA，溶于32μLEB。

1.3末端加“A”(A-Tailing)

(1)預(yù)先從-20℃保存的試劑盒中取出所需試劑，單個(gè)樣本配制量參見(jiàn)表2：

表2

(2)末端加“A”反應(yīng)：加入32μL上一步純化回收的DNA后將1.5mL離心管置于Thermomixer中37℃溫浴30分鐘。使用1.8×核酸純化磁珠回收純化反應(yīng)體系中的DNA，溶于18μL EB中。

1.4接頭的連接(Adapter Ligation)

(1)預(yù)先從-20℃保存的試劑盒中取出所需試劑，單個(gè)樣本配制量參見(jiàn)表3：

表3

(2)接頭的連接反應(yīng)：加入18μL上一步純化回收的DNA后將樣本管置于Thermomixer中20℃溫浴15分鐘。使用1.8×核酸純化磁珠回收純化反應(yīng)體系中的DNA，溶于30μL的EB中。

1.5 PCR反應(yīng)

(1)從-20℃保存的試劑盒中取出所需試劑，2mL的PCR管中配制PCR反應(yīng)體系：

表4

(2)設(shè)定PCR程序，PCR反應(yīng)的程序設(shè)定如下：

反應(yīng)結(jié)束及時(shí)將樣品取出放入4℃冰箱保存并按要求退出或關(guān)閉儀器。

(3)用0.9×核酸純化磁珠回收純化反應(yīng)體系中的DNA，純化后的文庫(kù)溶于20μL的ddH₂O中。對(duì)文庫(kù)進(jìn)行Qubit檢測(cè)，將文庫(kù)送檢安捷倫2100。

1.6肺癌目標(biāo)區(qū)域捕獲芯片文庫(kù)雜交

(1)本實(shí)驗(yàn)中，用于提供雜交捕獲反應(yīng)的離子環(huán)境的緩沖液、以及用于洗脫物理吸附或非特異性雜交的清洗液、漂洗液均可從商業(yè)途徑獲得。

(2)準(zhǔn)備雜交文庫(kù)：將待雜交的DNA文庫(kù)在冰上融化，取總質(zhì)量1μg(在后續(xù)操作步驟中將此DNA文庫(kù)稱(chēng)為樣本文庫(kù))。

(3)制備Ann引物Pool：將樣本文庫(kù)Index對(duì)應(yīng)的標(biāo)簽引物In1(100μM)及公共引物(1000μM)各取1000pmol混合，(在后續(xù)操作步驟中將此混合物稱(chēng)為Ann引物pool)。

(4)雜交樣本的制備：向1.5mL EP管中加入5μL COT DNA(Human Cot-1DNA，Life technologies，1mg/mL)、1μg樣本文庫(kù)、Ann引物pool。用封口膜密封制備好的雜交樣本EP管，將盛有樣本文庫(kù)pool/COT DNA/Ann引物pool的EP管置于真空裝置中直到完全干燥。

(5)雜交樣本的溶液：向樣本文庫(kù)pool/COT DNA/Ann引物pool的干粉中加入：

7.5μL 2×雜交緩沖液

3μL 雜交組分A

(6)充分混勻后將上述混合物置于預(yù)先準(zhǔn)備好的95℃加熱模塊上變性10分鐘。

(7)將上述混合物轉(zhuǎn)移至含有4.5μL捕獲芯片的0.2mL平蓋PCR管中。充分渦旋震蕩3秒，將雜交樣品混合物置于47℃加熱模塊上16小時(shí)。加熱模塊的熱蓋溫度需設(shè)定為57℃，雜交后產(chǎn)物需進(jìn)行后續(xù)洗脫回收操作。

(8)將10×清洗液(Ⅰ，Ⅱ與Ⅲ)、10×漂洗液和2.5×磁珠清洗液配置成1×工作液。

表5

(9)將下列試劑在47℃加熱模塊中預(yù)熱：

400μL 1×漂洗液

100μL 1×清洗液I

1.7制備親和吸附磁珠

(1)將鏈霉親和素磁珠(Dynabeads M-280Streptavidin，以下簡(jiǎn)稱(chēng)磁珠)在室溫下平衡30分鐘后，將磁珠充分渦旋混勻15秒。

(2)向1.5mL離心管中分裝100μL磁珠，將盛有100μL磁珠的離心管置于磁力架上，約5分鐘后小心吸棄上清，加兩倍于磁珠初始體積的1×磁珠清洗液，渦旋混勻10秒。將盛有磁珠的離心管放回磁力架，吸附磁珠。待溶液澄清，吸棄上清。重復(fù)次步驟，共洗滌兩次。

(3)洗滌完畢后吸棄磁珠清洗液，用磁珠初始體積的1×磁珠清洗液渦旋重懸磁珠轉(zhuǎn)入0.2mL的PCR管中。將PCR管置于磁力架上吸附磁珠澄清后吸棄上清。

1.8 DNA與親和吸附磁珠的結(jié)合及漂洗

(1)將雜交的樣本文庫(kù)轉(zhuǎn)入盛有親和吸附磁珠的0.2mL PCR管中，渦旋振蕩混勻。

(2)將0.2mL PCR管置于47℃加熱模塊45分鐘，每隔15分鐘渦旋混勻一次，使DNA與磁珠結(jié)合。

(3)45分鐘孵育后，向15μL捕獲的DNA樣本中加入47℃預(yù)熱的1×清洗液I 100μL。渦旋混勻10秒。將0.2mL PCR管中的全部組分轉(zhuǎn)入1.5mL離心管中。將1.5mL離心管置于磁力架上吸附磁珠，棄上清。

(4)將1.5mL離心管從磁力架上取下，加入200μL預(yù)熱47℃的1×漂洗液。吸打混勻10次(需迅速操作，防止試劑、樣品溫度低于47℃)。混勻后樣本置于47℃加熱模塊上5分鐘。重復(fù)此步驟，用47℃的1×漂洗液共洗滌兩次。將1.5mL的離心管置于磁力架上，吸附磁珠，棄上清。

(5)向上述1.5mL離心管中加入200μL室溫的1×清洗液I，渦旋混勻2分鐘。將離心管置于磁力架上，吸附磁珠，棄上清。向上述1.5mL離心管中加入200μL室溫的1×清洗液Ⅱ，渦旋混勻1分鐘。將離心管置于磁力架上，吸附磁珠，棄上清。向上述1.5mL離心管中加入200μL室溫的1×清洗液Ⅲ，渦旋混勻30秒。將離心管置于磁力架上，吸附磁珠，棄上清。

(6)1.5mL離心管從磁力架上取下，加入45μL PCR水，溶解洗脫磁珠捕獲樣本。

1.9捕獲DNA的PCR擴(kuò)增

(1)按下表制備捕獲后PCR mix，制備好后渦旋震蕩混勻。富集引物F和富集引物R均購(gòu)自英濰捷基公司。

(2)磁珠吸附DNA PCR的擴(kuò)增程序設(shè)定如下：

(3)雜交捕獲DNA PCR產(chǎn)物的回收純化：用核酸純化磁珠回收純化反應(yīng)體系中的DNA，磁珠使用量為0.9×，純化后的文庫(kù)溶于30μL的ddH₂O中。

1.10文庫(kù)定量

對(duì)文庫(kù)進(jìn)行2100Bio Analyzer(Agilent)/LabChip GX(Caliper)及QPCR檢測(cè)，記錄文庫(kù)濃度。

1.11文庫(kù)上機(jī)測(cè)序

構(gòu)建好的文庫(kù)用NextSeq 550AR(PE100)進(jìn)行測(cè)序。

1.12數(shù)據(jù)處理及分析

采用本發(fā)明的檢測(cè)循環(huán)腫瘤DNA樣本基因融合的裝置對(duì)1.12文庫(kù)上機(jī)測(cè)序的結(jié)果進(jìn)行處理分析。

本發(fā)明的用于檢測(cè)基因融合的裝置具備：

測(cè)序數(shù)據(jù)獲取模塊，用于獲取使用肺癌目標(biāo)區(qū)域捕獲芯片對(duì)待檢測(cè)的肺癌外周血樣本進(jìn)行捕獲測(cè)序而獲得測(cè)序數(shù)據(jù)。

比對(duì)模塊：其與所述測(cè)序數(shù)據(jù)獲取模塊相連接，用于將獲取的測(cè)序數(shù)據(jù)與參考序列進(jìn)行比對(duì)，獲取比對(duì)結(jié)果。所述比對(duì)結(jié)果包括測(cè)序片段在參考序列中對(duì)應(yīng)的位置。所述位置信息包括軟剪切信息和成功比對(duì)信息。所述測(cè)序片段中帶有軟剪切信息的部分為所述測(cè)序片段的軟剪切部，所述測(cè)序片段中帶有成功比對(duì)信息的部分為所述測(cè)序片段的成功比對(duì)部。該模塊利用bwa軟件，查找測(cè)序片段在基因中對(duì)應(yīng)的位置，并形成bam格式文件；該bam文件中包括每條測(cè)序片段的描述信息(qname)，序列信息(seq)，比對(duì)位置(POS)，位標(biāo)識(shí)(flag)，比對(duì)質(zhì)量值(MAPQ)，簡(jiǎn)要比對(duì)表達(dá)信息(Cigar)、模板長(zhǎng)度(Tlen)。

再比對(duì)模塊：其與所述比對(duì)模塊相連接，用于將帶有軟剪切信息的測(cè)序片段與參考基因組再次比對(duì)，獲取再比對(duì)結(jié)果。

所述再比對(duì)模塊包括以下子模塊：

長(zhǎng)度過(guò)濾子模塊：其與所述比對(duì)模塊相連接，用于過(guò)濾去除含有軟剪切(soft-clipping)信息的測(cè)序片段中長(zhǎng)度小于20bp的測(cè)序片段。

斷點(diǎn)判斷子模塊：其與所述長(zhǎng)度過(guò)濾子模塊相連接，用于根據(jù)所述長(zhǎng)度過(guò)濾子模塊的結(jié)果數(shù)據(jù)，將測(cè)序片段中帶有軟剪切信息的部分與帶有正常比對(duì)信息的部分的結(jié)合處作為斷點(diǎn)。

區(qū)分子模塊：其與所述斷點(diǎn)判斷子模塊相連接，用于將所述帶有軟剪切信息的部分和所述帶有正常比對(duì)信息的部分在斷點(diǎn)處分開(kāi)，并將這兩部分的序列信息分別保存至兩個(gè)fastq文件中。

再比對(duì)子模塊：其與所述區(qū)分子模塊相連接，用于對(duì)所述分別保存了序列信息的兩個(gè)文件與參考序列再次進(jìn)行比對(duì)，獲取再比對(duì)結(jié)果；再比對(duì)結(jié)果包括：每條測(cè)序片段的描述信息(qname)、序列信息(seq)、比對(duì)位置(POS)、位標(biāo)識(shí)(flag),比對(duì)質(zhì)量值(MAPQ)，簡(jiǎn)要比對(duì)表達(dá)信息(Cigar)，模板長(zhǎng)度(Tlen)。利用bwa軟件對(duì)上述兩個(gè)fastq文件，再次進(jìn)行比對(duì)，形成bam格式文件。所述bam格式文件包含每條測(cè)序片段的描述信息(qname)，序列信息(seq)、位標(biāo)識(shí)(flag),比對(duì)位置(POS),比對(duì)質(zhì)量值(MAPQ),簡(jiǎn)要比對(duì)表達(dá)信息(Cigar)，模板長(zhǎng)度(Tlen)。

真實(shí)融合斷點(diǎn)判斷模塊：其與所述再比對(duì)模塊相連接，用于判斷所述測(cè)序片段的融合斷點(diǎn)。

所述真實(shí)融合斷點(diǎn)判斷模塊包括下述子模塊：

過(guò)濾子模塊：其與所述再比對(duì)子模塊相連接，用于根據(jù)位標(biāo)識(shí)(flag)值過(guò)濾去除未成功比對(duì)(unmapped)的測(cè)序片段以及低比對(duì)質(zhì)量值(MAPQ)的測(cè)序片段；

斷點(diǎn)信息獲取子模塊：其與所述過(guò)濾子模塊相連接，用于查找具有相同片段描述信息的測(cè)序片段，并獲取斷點(diǎn)信息。斷點(diǎn)信息包括：(1)left_chr：斷點(diǎn)左側(cè)序列的染色體編號(hào)，read1對(duì)應(yīng)的參考序列編號(hào)。(2)left_pos:斷點(diǎn)左側(cè)首個(gè)堿基的比對(duì)位置，read1對(duì)應(yīng)的比對(duì)位置加上read1的序列長(zhǎng)度。(3)left_seq：斷點(diǎn)左側(cè)堿基的序列。(4)right_chr：斷點(diǎn)右側(cè)序列的染色體編號(hào)，read2對(duì)應(yīng)的參考序列編號(hào)。(5)right_pos：斷點(diǎn)右側(cè)首個(gè)堿基的比對(duì)位置，read2對(duì)應(yīng)的比對(duì)位置加上read2的序列長(zhǎng)度。(6)right_seq：斷點(diǎn)右側(cè)堿基的序列。(7)sup：斷點(diǎn)支持度，支持該斷點(diǎn)的測(cè)序片段個(gè)數(shù)，默認(rèn)為1。

融合斷點(diǎn)篩選子模塊：其與所述斷點(diǎn)信息獲取子模塊相連接，用于在斷點(diǎn)信息中篩選融合斷點(diǎn)。

融合斷點(diǎn)篩選子模塊包括如下元件：

斷點(diǎn)質(zhì)量過(guò)濾元件：用于過(guò)濾去掉低質(zhì)量斷點(diǎn)。若存在斷點(diǎn)A，A中sup個(gè)數(shù)大于5，且left_seq和right_seq中比對(duì)質(zhì)量值均大于30，且錯(cuò)配率均小于0.05，則該斷點(diǎn)A判斷為融合斷點(diǎn)。

相同斷點(diǎn)合并元件：用于合并相同斷點(diǎn)。若存在斷點(diǎn)A和B，A中l(wèi)eft_chr等于B中right_chr，A中right_chr等于B中l(wèi)eft_chr，A中l(wèi)eft_pos等于B中right_pos，A中right_pos等于B中l(wèi)eft_pos。A和B為同一個(gè)斷點(diǎn)的兩種形式，則該斷點(diǎn)A和斷點(diǎn)B合并為一個(gè)融合斷點(diǎn)。

融合斷點(diǎn)初次合并子模塊：其與所述融合斷點(diǎn)篩選子模塊相連接，用于將具有相同的斷點(diǎn)信息(left_chr、left_pos、right_chr和right_pos均相同)的斷點(diǎn)合并為一個(gè)真實(shí)融合斷點(diǎn)，并將具有相同斷點(diǎn)信息的斷點(diǎn)個(gè)數(shù)作為真實(shí)融合斷點(diǎn)的支持度。

融合斷點(diǎn)再次合并子模塊：其與所述斷點(diǎn)初次合并子模塊相連接，將left_chr和right_chr相同，但right_pos或left_pos相差5bp以內(nèi)的融合斷點(diǎn)合并為一個(gè)真實(shí)融合斷點(diǎn)。所述融合斷點(diǎn)再次合并模塊根據(jù)上述融合斷點(diǎn)信息，若存在融合斷點(diǎn)A中right_pos與融合斷點(diǎn)B中right_pos小于5，且融合斷點(diǎn)A中l(wèi)eft_pos與融合斷點(diǎn)B中l(wèi)eft_pos小于5，則將此融合斷點(diǎn)A和融合斷點(diǎn)B合并為一個(gè)基因融合斷點(diǎn)(gene fusion)。從而最終得到基因融合檢測(cè)結(jié)果。以及

輸出模塊：其與所述真實(shí)融合斷點(diǎn)判斷模塊相連接，用于輸出基因融合檢測(cè)結(jié)果。

檢測(cè)結(jié)果如下表所示。

1.13結(jié)果驗(yàn)證

采用QPCR方法對(duì)同一患者的組織FFPE樣本進(jìn)行驗(yàn)證，檢測(cè)其是否發(fā)生EML4-ALK的融合。檢測(cè)結(jié)果表明EML4與ALK發(fā)生融合，驗(yàn)證結(jié)果與1.12檢測(cè)結(jié)果一致。本發(fā)明的檢測(cè)裝置能夠成功檢出腫瘤循環(huán)DNA樣本的基因融合。

工業(yè)實(shí)用性

根據(jù)本發(fā)明，提供了一種檢測(cè)速度快、資源要求低、穩(wěn)定性高的用于檢測(cè)循環(huán)腫瘤DNA樣本基因融合的裝置及方法。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：董永芳;荊瑞琳;陳利斌;隋光磊;董超;玄兆伶;李大為;梁峻彬;陳重建
技術(shù)所有人：安諾優(yōu)達(dá)基因科技（北京）有限公司
我是此專(zhuān)利的發(fā)明人

上一篇：一種醬鹵羊肚的鹵料及鹵制方法與流程
上一篇：五香調(diào)料面及其制備工藝的制作方法與工藝

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

配對(duì)樣本差異基因分析相關(guān)技術(shù)

基因檢測(cè)樣本相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種用于檢測(cè)循環(huán)腫瘤DNA樣本基因融合的裝置的制作方法