一種用于檢測(cè)血液病相關(guān)體細(xì)胞突變的裝置的制作方法

文檔序號(hào)：12467412閱讀：213來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及低頻突變檢測(cè)領(lǐng)域，具體涉及一種用于檢測(cè)血液病相關(guān)體細(xì)胞突變的裝置及方法。
背景技術(shù)：
：血液病作為非實(shí)體瘤，其基因相關(guān)研究在癌癥中處于領(lǐng)先定位，血液病相關(guān)基因的檢測(cè)也是最早進(jìn)入臨床應(yīng)用的。近年來，由于分子生物學(xué)技術(shù)的發(fā)展，對(duì)血液病細(xì)胞分子遺傳學(xué)改變的了解也不斷深入。血液病相關(guān)的基因突變是體細(xì)胞突變(SNV)。迄今報(bào)道血液病涉及至少數(shù)十種融合基因。已經(jīng)認(rèn)識(shí)到大部分的血液病中存在著染色體結(jié)構(gòu)畸變，包括缺失、重復(fù)、倒位、易位等，導(dǎo)致原癌基因及抑癌基因結(jié)構(gòu)變異，原癌基因激活或抑癌基因失活，產(chǎn)生新的融合基因，編碼融合蛋白。有些基因是調(diào)控細(xì)胞增殖、分化和凋亡的轉(zhuǎn)錄因子，當(dāng)基因發(fā)生變異，直接影響了下游信號(hào)傳遞途徑，導(dǎo)致細(xì)胞增殖能力增強(qiáng)、凋亡障礙，分化障礙等，產(chǎn)生血液病表型。隨著血液病致病機(jī)理研究的深入和基因檢測(cè)技術(shù)的發(fā)展，血液病的遺傳物質(zhì)改變研究經(jīng)歷了染色體核型分析(細(xì)胞遺傳學(xué))檢測(cè)，融合基因基因檢測(cè)到點(diǎn)突變和微小缺失重復(fù)檢測(cè)。這三種不同維度的檢測(cè)，逐步成為血液病診治的依據(jù)和參考。另一方面，二代測(cè)序的主流平臺(tái)一般均采用邊合成邊測(cè)序(SequencingBySynthesis,SBS)技術(shù)進(jìn)行核酸測(cè)序。測(cè)序前，需要對(duì)核酸(DNA或RNA)樣本進(jìn)行測(cè)序文庫(kù)的構(gòu)建，基本流程如下：首先將片段化后的DNA進(jìn)行片段的末端修復(fù)，之后在修復(fù)后的片段3'端加“A”堿基，然后將上述DNA片段與含有測(cè)序引物結(jié)合位點(diǎn)的DNA接頭(Adapter)連接，最后通過PCR進(jìn)行擴(kuò)增，完成測(cè)序文庫(kù)構(gòu)建。針對(duì)于血液病的基因檢測(cè)的難點(diǎn)在于，血液病相關(guān)的樣本中并不是純的癌細(xì)胞，還有大量的正常白細(xì)胞在其中，檢測(cè)的難度就會(huì)隨著癌細(xì)胞所占比例的減少而增加。如何區(qū)分真正的SNV與二代測(cè)序中發(fā)生的PCR錯(cuò)誤、測(cè)序假陽(yáng)性及比對(duì)不準(zhǔn)確等帶來的噪音是當(dāng)前面臨的一大難題。技術(shù)實(shí)現(xiàn)要素：本發(fā)明所要解決的技術(shù)問題正如前述，基于現(xiàn)有的平臺(tái)，使用血液病相關(guān)樣本進(jìn)行SNV預(yù)測(cè)的難點(diǎn)在于將測(cè)序錯(cuò)誤與真實(shí)的SNV進(jìn)行準(zhǔn)確的區(qū)分。因此，本發(fā)明的目的在于提供一種能夠更準(zhǔn)確地區(qū)分測(cè)序錯(cuò)誤與真實(shí)SNV、從而更準(zhǔn)確地檢測(cè)血液病相關(guān)SNV的裝置及方法。本發(fā)明人經(jīng)過深入研究發(fā)現(xiàn)，通過收集大量的健康人樣本進(jìn)行平行試驗(yàn)，能夠確定基因組每一個(gè)位置的錯(cuò)誤率，從而更準(zhǔn)確地區(qū)分測(cè)序錯(cuò)誤與SNV，同時(shí)降低假陽(yáng)性與假陰性。即，本發(fā)明包括：一種用于檢測(cè)血液病相關(guān)體細(xì)胞突變(SNV)的裝置，其包括：數(shù)據(jù)獲取模塊，用于獲取血液病相關(guān)樣本DNA的測(cè)序數(shù)據(jù)及健康人群DNA的測(cè)序數(shù)據(jù)，所述測(cè)序數(shù)據(jù)包括所述血液病相關(guān)樣本DNA各位點(diǎn)的突變頻率、以及與所述血液病相關(guān)樣本DNA各位點(diǎn)對(duì)應(yīng)的健康人群中的每個(gè)個(gè)體的DNA各位點(diǎn)的突變頻率；通常，所述血液病相關(guān)樣本DNA的測(cè)序數(shù)據(jù)可以來自對(duì)待測(cè)血液病相關(guān)樣本DNA進(jìn)行測(cè)序而獲得的數(shù)據(jù)；所述健康人群DNA的測(cè)序數(shù)據(jù)可以來自已經(jīng)建立的健康人群DNA數(shù)據(jù)庫(kù)，或者來自對(duì)健康人群生物樣本DNA進(jìn)行測(cè)序(測(cè)序方法應(yīng)與針對(duì)所述待測(cè)血液病相關(guān)樣本DNA的測(cè)序方法相同，即平行測(cè)序)而獲得的數(shù)據(jù)；突變頻率統(tǒng)計(jì)模塊，其與所述數(shù)據(jù)獲取模塊相連接，用于統(tǒng)計(jì)所述健康人群群體的所述DNA各位點(diǎn)中的每一個(gè)位點(diǎn)的突變頻率分布情況，得到健康人群突變頻率統(tǒng)計(jì)模型；對(duì)比模塊，其與所述數(shù)據(jù)獲取模塊及所述突變頻率統(tǒng)計(jì)模塊相連接，用于將所述血液樣本DNA各位點(diǎn)的突變頻率與所述健康人群突變頻率統(tǒng)計(jì)模型進(jìn)行對(duì)比，獲得對(duì)比結(jié)果；判定模塊，其與所述對(duì)比模塊相連接，用于判定所述血液樣本DNA各位點(diǎn)的突變是否為真實(shí)的體細(xì)胞突變，獲得判定結(jié)果；其中，當(dāng)所述對(duì)比結(jié)果為無(wú)顯著差異時(shí)，判定結(jié)果為非體細(xì)胞突變(包括系統(tǒng)錯(cuò)誤及一部分胚系突變)；當(dāng)所述對(duì)比結(jié)果為有顯著差異、且突變頻率小于設(shè)定值時(shí)，判定結(jié)果為真實(shí)的體細(xì)胞突變；當(dāng)所述對(duì)比結(jié)果為有顯著差異、且突變頻率大于或等于設(shè)定值時(shí)，判定結(jié)果為胚系突變；所述設(shè)定值可以根據(jù)測(cè)序的實(shí)際情況進(jìn)行合理設(shè)定，例如，在測(cè)序深度在100×?xí)r，優(yōu)選的設(shè)定值可以為35％；以及檢測(cè)結(jié)果輸出模塊，其與所述判定模塊相連接，用于輸出所述判定模塊的所述判定結(jié)果。優(yōu)選地，所述數(shù)據(jù)獲取模塊包括血液病相關(guān)樣本DNA各位點(diǎn)的突變頻率獲取模塊，該模塊進(jìn)一步包括下述子模塊：過濾子模塊，其與所述數(shù)據(jù)獲取模塊相連接，用于對(duì)測(cè)序數(shù)據(jù)進(jìn)行質(zhì)檢，過濾去除低質(zhì)量的測(cè)序數(shù)據(jù)；比對(duì)子模塊，其與所述過濾子模塊相連接，用于將過濾后的測(cè)序數(shù)據(jù)與參考序列進(jìn)行比對(duì)，獲取測(cè)序片段在基因組中對(duì)應(yīng)的位置；預(yù)處理子模塊，其與所述比對(duì)子模塊相連接，用于去除重復(fù)的測(cè)序片段；以及統(tǒng)計(jì)子模塊，其與所述預(yù)處理子模塊相連接，用于統(tǒng)計(jì)血液病相關(guān)樣本DNA各位點(diǎn)的突變頻率。優(yōu)選地，所述統(tǒng)計(jì)子模塊篩選出血液病相關(guān)樣本DNA各位點(diǎn)中的可信度值(LOD值)大于設(shè)定值(例如100)的位點(diǎn)并進(jìn)行突變頻率統(tǒng)計(jì)。針對(duì)每一個(gè)樣本的每一個(gè)位點(diǎn)i，i∈{人類基因組}，待測(cè)樣本的針對(duì)該位點(diǎn)的檢測(cè)LOD的計(jì)算公式如下：公式中的各個(gè)部分又是由下列公式獲得：以下面兩種模式來描述數(shù)據(jù)：modelM0表示在該位點(diǎn)沒有變異，任何的非參考位點(diǎn)的堿基都被認(rèn)為是測(cè)序噪音；model表示在該位點(diǎn)有真實(shí)的m突變，并且等位基因頻率為f。M0就相當(dāng)于是f＝0時(shí)的參考位點(diǎn)為r∈{A,T,C,G}，而對(duì)于每條readi(i＝1…d)，覆蓋這個(gè)位點(diǎn)的堿基為bi，這個(gè)堿基的錯(cuò)誤概率為ei(此錯(cuò)誤概率由每個(gè)堿基的質(zhì)量值ei獲得，)。優(yōu)選地，所述數(shù)據(jù)獲取模塊包括與所述血液樣本DNA各位點(diǎn)對(duì)應(yīng)的健康人群中的每個(gè)個(gè)體的DNA各位點(diǎn)的突變頻率獲取模塊，該模塊進(jìn)一步包括下述子模塊：過濾子模塊，其與所述數(shù)據(jù)獲取模塊相連接，用于對(duì)測(cè)序數(shù)據(jù)進(jìn)行質(zhì)檢，過濾去除低質(zhì)量的測(cè)序數(shù)據(jù)；比對(duì)子模塊，其與所述過濾子模塊相連接，用于將過濾后的測(cè)序數(shù)據(jù)與參考序列進(jìn)行比對(duì)，獲取測(cè)序片段在基因組中對(duì)應(yīng)的位置；預(yù)處理子模塊，其與所述比對(duì)子模塊相連接，用于去除重復(fù)的測(cè)序片段；以及統(tǒng)計(jì)子模塊，其與所述預(yù)處理子模塊相連接，用于統(tǒng)計(jì)與所述血液病相關(guān)樣本DNA各位點(diǎn)對(duì)應(yīng)的健康人群中的每個(gè)個(gè)體的DNA各位點(diǎn)的突變頻率。優(yōu)選地，所述突變頻率統(tǒng)計(jì)模塊包括模型校正子模塊，所述模型校正子模塊用于利用得到的健康人群突變頻率統(tǒng)計(jì)模型，對(duì)與所述血液病相關(guān)樣本DNA各位點(diǎn)對(duì)應(yīng)的健康人群中的每個(gè)個(gè)體的DNA各位點(diǎn)進(jìn)行評(píng)估而舍去明顯偏離的位點(diǎn)，并統(tǒng)計(jì)余下的各位點(diǎn)中的每一個(gè)位點(diǎn)的突變頻率的分布情況，得到新的健康人群突變頻率統(tǒng)計(jì)模型。優(yōu)選地，所述判定模塊包括下述子模塊：突變顯著性判定子模塊，其與所述對(duì)比模塊相連接，用于判定所述血液病相關(guān)樣本DNA各位點(diǎn)的突變的顯著性；以及突變類型判定子模塊，其與所述突變顯著性判定子模塊相連接，用于判定所述血液病相關(guān)樣本DNA各位點(diǎn)的具有顯著性的突變的類型是體細(xì)胞突變還是胚系突變。優(yōu)選地，所述突變顯著性判定子模塊判定所述血液病相關(guān)樣本DNA各位點(diǎn)的突變頻率是否與健康人群突變頻率統(tǒng)計(jì)模型中對(duì)應(yīng)位點(diǎn)的突變頻率存在顯著差異(例如判據(jù)為正態(tài)分布，P<0.05)，有顯著差異則為真實(shí)突變，無(wú)顯著差異則為假陽(yáng)性突變。優(yōu)選地，檢測(cè)結(jié)果輸出模塊輸出血液病相關(guān)樣本DNA各位點(diǎn)的具有顯著性的突變的位置和突變類型。優(yōu)選地，所述血液病相關(guān)的樣本是外周血或骨髓。這里，所述體細(xì)胞突變是指血液病相關(guān)的體細(xì)胞突變。此外，本發(fā)明還提供：一種用于利用檢測(cè)血液病相關(guān)體細(xì)胞突變(SNV)的方法，其包括：數(shù)據(jù)獲取步驟，獲取血液病相關(guān)樣本DNA的測(cè)序數(shù)據(jù)及健康人群DNA的測(cè)序數(shù)據(jù)，所述測(cè)序數(shù)據(jù)包括所述血液樣本DNA各位點(diǎn)的突變頻率、以及與所述血液病相關(guān)樣本DNA各位點(diǎn)對(duì)應(yīng)的健康人群中的每個(gè)個(gè)體的DNA各位點(diǎn)的突變頻率；通常，所述血液病相關(guān)樣本DNA的測(cè)序數(shù)據(jù)可以來自對(duì)待測(cè)血液病相關(guān)樣本DNA進(jìn)行測(cè)序而獲得的數(shù)據(jù)；所述健康人群DNA的測(cè)序數(shù)據(jù)可以來自已經(jīng)建立的健康人群DNA數(shù)據(jù)庫(kù)，或者來自對(duì)健康人群生物樣本DNA進(jìn)行測(cè)序(測(cè)序方法應(yīng)與針對(duì)所述待測(cè)血液病相關(guān)樣本DNA的測(cè)序方法相同，即平行測(cè)序)而獲得的數(shù)據(jù)；突變頻率統(tǒng)計(jì)步驟，統(tǒng)計(jì)所述健康人群群體的所述DNA各位點(diǎn)中的每一個(gè)位點(diǎn)的突變頻率分布情況，得到健康人群突變頻率統(tǒng)計(jì)模型；對(duì)比步驟，將所述血液病相關(guān)樣本DNA各位點(diǎn)的突變頻率與所述健康人群突變頻率統(tǒng)計(jì)模型進(jìn)行對(duì)比，獲得對(duì)比結(jié)果；判定步驟，判定所述血液病相關(guān)樣本DNA各位點(diǎn)的突變是否為真實(shí)的體細(xì)胞突變，獲得判定結(jié)果；其中，當(dāng)所述對(duì)比結(jié)果為無(wú)顯著差異時(shí)，判定結(jié)果為非體細(xì)胞突變(包括系統(tǒng)錯(cuò)誤及一部分胚系突變)；當(dāng)所述對(duì)比結(jié)果為有顯著差異、且突變頻率小于設(shè)定值時(shí)，判定結(jié)果為真實(shí)的體細(xì)胞突變；當(dāng)所述對(duì)比結(jié)果為有顯著差異、且突變頻率大于或等于設(shè)定值時(shí)，判定結(jié)果為胚系突變；所述設(shè)定值可以根據(jù)測(cè)序的實(shí)際情況進(jìn)行合理設(shè)定，例如，在測(cè)序深度在100×?xí)r，優(yōu)選的設(shè)定值可以為35％；以及檢測(cè)結(jié)果輸出步驟，輸出所述判定步驟的所述判定結(jié)果。優(yōu)選地，所述數(shù)據(jù)獲取步驟包括血液病相關(guān)樣本DNA各位點(diǎn)的突變頻率獲取步驟，該步驟進(jìn)一步包括下述子步驟：過濾子步驟，對(duì)測(cè)序數(shù)據(jù)進(jìn)行質(zhì)檢，過濾去除低質(zhì)量的測(cè)序數(shù)據(jù)；比對(duì)子步驟，將過濾后的測(cè)序數(shù)據(jù)與參考序列進(jìn)行比對(duì)，獲取測(cè)序片段在基因組中對(duì)應(yīng)的位置；預(yù)處理子步驟，去除重復(fù)的測(cè)序片段；以及統(tǒng)計(jì)子步驟，統(tǒng)計(jì)血液病相關(guān)樣本DNA各位點(diǎn)的突變頻率。優(yōu)選地，所述統(tǒng)計(jì)子步驟篩選出血液病相關(guān)樣本DNA各位點(diǎn)中的可信度值(LOD值)大于設(shè)定值(例如100)的位點(diǎn)并進(jìn)行突變頻率統(tǒng)計(jì)。針對(duì)每一個(gè)樣本的每一個(gè)位點(diǎn)i，i∈{人類基因組}，待測(cè)樣本的針對(duì)該位點(diǎn)的檢測(cè)LOD的計(jì)算公式如下：公式中的各個(gè)部分又是由下列公式獲得：以下面兩種模式來描述數(shù)據(jù)：modelM0表示在該位點(diǎn)沒有變異，任何的非參考位點(diǎn)的堿基都被認(rèn)為是測(cè)序噪音；model表示在該位點(diǎn)有真實(shí)的m突變，并且等位基因頻率為f。M0就相當(dāng)于是f＝0時(shí)的參考位點(diǎn)為r∈{A,T,C,G}，而對(duì)于每條readi(i＝1…d)，覆蓋這個(gè)位點(diǎn)的堿基為bi，這個(gè)堿基的錯(cuò)誤概率為ei(此錯(cuò)誤概率由每個(gè)堿基的質(zhì)量值ei獲得，)。優(yōu)選地，所述數(shù)據(jù)獲取步驟包括與所述血液病相關(guān)樣本DNA各位點(diǎn)對(duì)應(yīng)的健康人群中的每個(gè)個(gè)體的DNA各位點(diǎn)的突變頻率獲取步驟，該步驟進(jìn)一步包括下述子步驟：過濾子步驟，對(duì)測(cè)序數(shù)據(jù)進(jìn)行質(zhì)檢，過濾去除低質(zhì)量的測(cè)序數(shù)據(jù)；比對(duì)子步驟，將過濾后的測(cè)序數(shù)據(jù)與參考序列進(jìn)行比對(duì)，獲取測(cè)序片段在基因組中對(duì)應(yīng)的位置；預(yù)處理子步驟，去除重復(fù)的測(cè)序片段；以及統(tǒng)計(jì)子步驟，統(tǒng)計(jì)與所述血液病相關(guān)樣本DNA各位點(diǎn)對(duì)應(yīng)的健康人群中的每個(gè)個(gè)體的DNA各位點(diǎn)的突變頻率。優(yōu)選地，所述突變頻率統(tǒng)計(jì)步驟包括模型校正子步驟，所述模型校正子步驟用于利用得到的健康人群突變頻率統(tǒng)計(jì)模型，對(duì)與所述血液病相關(guān)樣本DNA各位點(diǎn)對(duì)應(yīng)的健康人群中的每個(gè)個(gè)體的DNA各位點(diǎn)進(jìn)行評(píng)估而舍去明顯偏離的位點(diǎn)，并統(tǒng)計(jì)余下的各位點(diǎn)中的每一個(gè)位點(diǎn)的突變頻率的分布情況，得到新的健康人群突變頻率統(tǒng)計(jì)模型。優(yōu)選地，所述判定步驟包括下述子步驟：突變顯著性判定子步驟，判定所述血液病相關(guān)樣本DNA各位點(diǎn)的突變的顯著性；以及突變類型判定子步驟，判定所述血液病相關(guān)樣本DNA各位點(diǎn)的具有顯著性的突變的類型是體細(xì)胞突變還是胚系突變。優(yōu)選地，所述突變顯著性判定子步驟判定所述血液病相關(guān)樣本DNA各位點(diǎn)的突變頻率是否與健康人群突變頻率統(tǒng)計(jì)模型中對(duì)應(yīng)位點(diǎn)的突變頻率存在顯著差異(例如判據(jù)為正態(tài)分布，P<0.05)，有顯著差異則為真實(shí)突變，無(wú)顯著差異則為假陽(yáng)性突變。優(yōu)選地，檢測(cè)結(jié)果輸出步驟輸出血液病相關(guān)樣本DNA各位點(diǎn)的具有顯著性的突變的位置和突變類型。優(yōu)選地，所述血液病相關(guān)的樣本是外周血或骨髓。這里，所述體細(xì)胞突變是指血液病相關(guān)的體細(xì)胞突變。根據(jù)本發(fā)明，能夠更準(zhǔn)確地將系統(tǒng)錯(cuò)誤與真實(shí)的SNV進(jìn)行區(qū)分，不僅提高了靈敏度，而且降低了假陽(yáng)性與假陰性。附圖說明圖1是本發(fā)明的用于檢測(cè)血液病相關(guān)體細(xì)胞突變的裝置的一例的示意圖。發(fā)明的具體實(shí)施方式本說明書中提及的科技術(shù)語(yǔ)具有與本領(lǐng)域技術(shù)人員通常理解的含義相同的含義，如有沖突以本說明書中的定義為準(zhǔn)。一般而言，本說明書中采用的術(shù)語(yǔ)具有如下含義。貝塔分布：Beta分布是一個(gè)連續(xù)分布，是描述概率p的分布，取值范圍為0到1。Beta分布有α和β兩個(gè)參數(shù)，其中α為成功次數(shù)加1，β為失敗次數(shù)加1。亞克隆：對(duì)培養(yǎng)的細(xì)胞來說，從原有的克隆中，再篩選出具有某種特性的細(xì)胞進(jìn)行培養(yǎng)，就是亞克隆。目標(biāo)序列捕獲測(cè)序：是將感興趣的基因組區(qū)域定制成特異性探針與基因組DNA在序列捕獲芯片(或溶液)進(jìn)行雜交，將目標(biāo)基因組區(qū)域的DNA片段進(jìn)行富集后再利用第二代測(cè)序技術(shù)進(jìn)行測(cè)序的研究策略。體細(xì)胞突變(SNV)：是指除性細(xì)胞外的體細(xì)胞發(fā)生的突變。不會(huì)造成后代的遺傳改變，卻可以引起當(dāng)代某些細(xì)胞的遺傳結(jié)構(gòu)發(fā)生改變。胚系突變(SNP)：遺傳性基因缺陷是通過卵子或精子傳遞的，所有的胚胎細(xì)胞都含有同樣的遺傳缺陷，這種缺陷存在于生殖細(xì)胞內(nèi)，代代相傳。正鏈：與RNA序列相同的那一個(gè)DNA單鏈；復(fù)制中，正鏈就是與新鏈序列相同的原單鏈，非模板鏈。實(shí)施例以下給出實(shí)施例，對(duì)本發(fā)明進(jìn)行更具體的說明，但本發(fā)明不限于這些實(shí)施例。實(shí)施例1本發(fā)明的用于檢測(cè)血液病相關(guān)體細(xì)胞突變的裝置實(shí)施例1的用于檢測(cè)血液病相關(guān)體細(xì)胞突變的裝置具備：數(shù)據(jù)獲取模塊，用于獲取血液病相關(guān)樣本DNA的測(cè)序數(shù)據(jù)及健康人群DNA的測(cè)序數(shù)據(jù)，所述測(cè)序數(shù)據(jù)包括所述血液病相關(guān)樣本DNA各位點(diǎn)的突變頻率、以及與所述血液病相關(guān)樣本DNA各位點(diǎn)對(duì)應(yīng)的健康人群中的每個(gè)個(gè)體的DNA各位點(diǎn)的突變頻率；通常，所述血液病相關(guān)樣本DNA的測(cè)序數(shù)據(jù)來自對(duì)待測(cè)血液病相關(guān)樣本DNA進(jìn)行測(cè)序而獲得的數(shù)據(jù)，所述健康人群DNA的測(cè)序數(shù)據(jù)來自已經(jīng)建立的健康人群DNA數(shù)據(jù)庫(kù)；突變頻率統(tǒng)計(jì)模塊，其與所述數(shù)據(jù)獲取模塊相連接，用于統(tǒng)計(jì)所述健康人群群體的所述DNA各位點(diǎn)中的每一個(gè)位點(diǎn)的突變頻率分布情況，得到健康人群突變頻率統(tǒng)計(jì)模型；對(duì)比模塊，其與所述數(shù)據(jù)獲取模塊及所述突變頻率統(tǒng)計(jì)模塊相連接，用于將所述血液病相關(guān)樣本DNA各位點(diǎn)的突變頻率與所述健康人群突變頻率統(tǒng)計(jì)模型進(jìn)行對(duì)比，獲得對(duì)比結(jié)果；判定模塊，其與所述對(duì)比模塊相連接，用于判定所述血液病相關(guān)樣本DNA各位點(diǎn)的突變是否為真實(shí)的體細(xì)胞突變，獲得判定結(jié)果；其中，當(dāng)所述對(duì)比結(jié)果為有顯著差異、且突變頻率小于設(shè)定值時(shí)，判定結(jié)果為真實(shí)的體細(xì)胞突變；以及檢測(cè)結(jié)果輸出模塊，其與所述判定模塊相連接，用于輸出所述判定模塊的所述判定結(jié)果。所述數(shù)據(jù)獲取模塊包括血液病相關(guān)樣本DNA各位點(diǎn)的突變頻率獲取模塊，該模塊進(jìn)一步包括下述子模塊：過濾子模塊，其與所述數(shù)據(jù)獲取模塊相連接，用于對(duì)測(cè)序數(shù)據(jù)進(jìn)行質(zhì)檢，過濾去除低質(zhì)量的測(cè)序數(shù)據(jù)(小于Q30)，得到cleanfastqdata；比對(duì)子模塊，其與所述過濾子模塊相連接，用于將過濾后的測(cè)序數(shù)據(jù)與參考序列進(jìn)行比對(duì)，獲取測(cè)序片段(reads)在基因組中對(duì)應(yīng)的位置；具體而言，用BWA軟件對(duì)cleanfastqdata進(jìn)行比對(duì)得到sam格式文件，用samtools將sam格式文件轉(zhuǎn)為bam格式(其中包含reads在基因組中對(duì)應(yīng)的位置的信息)，節(jié)省內(nèi)存空間；預(yù)處理子模塊，其與所述比對(duì)子模塊相連接，用于去除重復(fù)的測(cè)序片段；具體而言，預(yù)處理模塊處理所述bam文件，去除重復(fù)的reads，得到uniquebam文件；統(tǒng)計(jì)子模塊，其與所述預(yù)處理子模塊相連接，用于統(tǒng)計(jì)血液樣本DNA各位點(diǎn)的突變頻率；具體而言，所述統(tǒng)計(jì)子模塊針對(duì)每一個(gè)樣本的每一個(gè)位點(diǎn)i，i∈{人類基因組}，待測(cè)樣本的針對(duì)該位點(diǎn)的檢測(cè)LOD的計(jì)算公式如下：公式中的各個(gè)部分又是由下列公式獲得：以下面兩種模式來描述數(shù)據(jù)：modelM0表示在該位點(diǎn)沒有變異，任何的非參考位點(diǎn)的堿基都被認(rèn)為是測(cè)序噪音；model表示在該位點(diǎn)有真實(shí)的m突變，并且等位基因頻率為f。M0就相當(dāng)于是f＝0時(shí)的參考位點(diǎn)為r∈{A,T,C,G}，而對(duì)于每條readi(i＝1…d)覆蓋這個(gè)位點(diǎn)的堿基為bi，這個(gè)堿基的錯(cuò)誤概率為ei(此錯(cuò)誤概率由每個(gè)堿基的質(zhì)量值ei獲得，)。最終，篩選LOD>100的位點(diǎn)，獲取突變頻率。所述數(shù)據(jù)獲取模塊還包括與所述血液病相關(guān)樣本DNA各位點(diǎn)對(duì)應(yīng)的健康人群中的每個(gè)個(gè)體的DNA各位點(diǎn)的突變頻率獲取模塊，該模塊與所述血液樣本DNA各位點(diǎn)的突變頻率獲取模塊的區(qū)別在于：其統(tǒng)計(jì)子模塊不篩選LOD值大于設(shè)定值的位點(diǎn)，而是獲取所有與所述血液病相關(guān)樣本DNA各位點(diǎn)對(duì)應(yīng)的健康人群中的每個(gè)個(gè)體的DNA各位點(diǎn)的突變頻率。所述突變頻率統(tǒng)計(jì)模塊用于統(tǒng)計(jì)所述健康人群群體的所述DNA各位點(diǎn)中的每一個(gè)位點(diǎn)的突變頻率的分布情況，得到健康人群突變頻率統(tǒng)計(jì)模型。該突變頻率統(tǒng)計(jì)模塊包括模型校正子模塊，所述模型校正子模塊用于利用得到的健康人群突變頻率統(tǒng)計(jì)模型，對(duì)與所述血液病相關(guān)樣本DNA各位點(diǎn)對(duì)應(yīng)的健康人群中的每個(gè)個(gè)體的DNA各位點(diǎn)進(jìn)行評(píng)估而舍去明顯偏離(正態(tài)分布，P＞0.05)的位點(diǎn)，并統(tǒng)計(jì)余下的各位點(diǎn)中的每一個(gè)位點(diǎn)的突變頻率的情況，直至沒有明顯偏離的點(diǎn)，得到新的健康人群突變頻率統(tǒng)計(jì)模型。所述判定模塊包括下述子模塊：突變顯著性判定子模塊，其與所述對(duì)比模塊相連接，用于判定所述血液病相關(guān)樣本DNA各位點(diǎn)的突變的顯著性；以及突變類型判定子模塊，其與所述突變顯著性判定子模塊相連接，用于判定所述血液病相關(guān)樣本DNA各位點(diǎn)的具有顯著性的突變的類型是體細(xì)胞突變還是胚系突變。所述突變顯著性判定子模塊判定所述血液病相關(guān)樣本DNA各位點(diǎn)的突變頻率是否與健康人群突變頻率統(tǒng)計(jì)模型中對(duì)應(yīng)位點(diǎn)的突變頻率存在顯著差異，例如判據(jù)為正態(tài)分布、P<0.05，有顯著差異則為真實(shí)突變，無(wú)顯著差異則為假陽(yáng)性突變。對(duì)于有顯著差異的真實(shí)突變，當(dāng)突變頻率小于35％時(shí)，判定為真實(shí)的體細(xì)胞突變；當(dāng)突變頻率大于或等于35％時(shí)，判定為胚系突變。檢測(cè)結(jié)果輸出模塊輸出的信息包括：真實(shí)突變位置(例如12號(hào)染色體上1444444絕對(duì)位置，參考基因組為HG19)、突變類型(例如體細(xì)胞突變)及突變堿基(例如A->T,R172K)，突變頻率(如12.34％)，突變基因(如EGFR)，詳情(例如包括基因，轉(zhuǎn)錄本，外顯子，堿基突變情況，氨基酸突變情況等)。實(shí)施例2對(duì)一例血液病患者的血液樣本進(jìn)行體細(xì)胞突變檢測(cè)。1.1血液樣本DNA提取使用過膜法提取血液樣本基因組DNA，具體步驟參照天根公司血液/細(xì)胞/組織基因組DNA提取試劑盒操作手冊(cè)1.2末端修復(fù)(EndRepair)(1)預(yù)先從-20℃保存的試劑盒中取出所需試劑，單個(gè)樣本配制量參見表1。表1(2)末端修復(fù)反應(yīng)：加入DNA樣本后將1.5mL離心管置于Thermomixer中20℃溫浴30分鐘。反應(yīng)結(jié)束后使用1.8×核酸純化磁珠回收純化反應(yīng)體系中的DNA，溶于32μLEB。1.3末端加“A”(A-Tailing)(1)預(yù)先從-20℃保存的試劑盒中取出所需試劑，單個(gè)樣本配制量參見表2：表2(2)末端加“A”反應(yīng)：加入32μL上一步純化回收的DNA后將1.5mL離心管置于Thermomixer中37℃溫浴30分鐘。使用1.8×核酸純化磁珠回收純化反應(yīng)體系中的DNA，溶于18μLEB中。1.4接頭的連接(AdapterLigation)(1)預(yù)先從-20℃保存的試劑盒中取出所需試劑，單個(gè)樣本配制量參見表3：表3(2)接頭的連接反應(yīng)：加入18μL上一步純化回收的DNA后將樣本管置于Thermomixer中20℃溫浴15分鐘。使用1.8×核酸純化磁珠回收純化反應(yīng)體系中的DNA，溶于30μL的EB中。1.5PCR反應(yīng)(1)從-20℃保存的試劑盒中取出所需試劑，2mL的PCR管中配制PCR反應(yīng)體系：表4(2)設(shè)定PCR程序，PCR反應(yīng)的程序設(shè)定如下：反應(yīng)結(jié)束及時(shí)將樣品取出放入4℃冰箱保存并按要求退出或關(guān)閉儀器。(3)用0.9×核酸純化磁珠回收純化反應(yīng)體系中的DNA，純化后的文庫(kù)溶于20μL的ddH2O中。對(duì)文庫(kù)進(jìn)行Qubit檢測(cè)，將文庫(kù)送檢安捷倫2100。1.6血液病目標(biāo)區(qū)域捕獲芯片文庫(kù)雜交(1)本實(shí)驗(yàn)中，用于提供雜交捕獲反應(yīng)的離子環(huán)境的緩沖液、以及用于洗脫物理吸附或非特異性雜交的清洗液、漂洗液均可從商業(yè)途徑獲得。(2)準(zhǔn)備雜交文庫(kù)：將待雜交的DNA文庫(kù)在冰上融化，取總質(zhì)量1μg(在后續(xù)操作步驟中將此DNA文庫(kù)稱為樣本文庫(kù))。(3)制備Ann引物Pool：將樣本文庫(kù)Index對(duì)應(yīng)的標(biāo)簽引物In1(100μM)及公共引物(1000μM)各取1000pmol混合，(在后續(xù)操作步驟中將此混合物稱為Ann引物pool)。(4)雜交樣本的制備：向1.5mLEP管中加入5μLCOTDNA(HumanCot-1DNA，Lifetechnologies，1mg/mL)、1μg樣本文庫(kù)、Ann引物pool。用封口膜密封制備好的雜交樣本EP管，將盛有樣本文庫(kù)pool/COTDNA/Ann引物pool的EP管置于真空裝置中直到完全干燥。(5)雜交樣本的溶液：向樣本文庫(kù)pool/COTDNA/Ann引物pool的干粉中加入：7.5μL2×雜交緩沖液3μL雜交組分A(6)充分混勻后將上述混合物置于預(yù)先準(zhǔn)備好的95℃加熱模塊上變性10分鐘。(7)將上述混合物轉(zhuǎn)移至含有4.5μL捕獲芯片的0.2mL平蓋PCR管中。充分渦旋震蕩3秒，將雜交樣品混合物置于47℃加熱模塊上16小時(shí)。加熱模塊的熱蓋溫度需設(shè)定為57℃，雜交后產(chǎn)物需進(jìn)行后續(xù)洗脫回收操作。(8)將10×清洗液(Ⅰ，Ⅱ與Ⅲ)、10×漂洗液和2.5×磁珠清洗液配置成1×工作液。表5(9)將下列試劑在47℃加熱模塊中預(yù)熱：400μL1×漂洗液100μL1×清洗液I1.7制備親和吸附磁珠(1)將鏈霉親和素磁珠(DynabeadsM-280Streptavidin，以下簡(jiǎn)稱磁珠)在室溫下平衡30分鐘后，將磁珠充分渦旋混勻15秒。(2)向1.5mL離心管中分裝100μL磁珠，將盛有100μL磁珠的離心管置于磁力架上，約5分鐘后小心吸棄上清，加兩倍于磁珠初始體積的1×磁珠清洗液，渦旋混勻10秒。將盛有磁珠的離心管放回磁力架，吸附磁珠。待溶液澄清，吸棄上清。重復(fù)次步驟，共洗滌兩次。(3)洗滌完畢后吸棄磁珠清洗液，用磁珠初始體積的1×磁珠清洗液渦旋重懸磁珠轉(zhuǎn)入0.2mL的PCR管中。將PCR管置于磁力架上吸附磁珠澄清后吸棄上清。1.8DNA與親和吸附磁珠的結(jié)合及漂洗(1)將雜交的樣本文庫(kù)轉(zhuǎn)入盛有親和吸附磁珠的0.2mLPCR管中，渦旋振蕩混勻。(2)將0.2mLPCR管置于47℃加熱模塊45分鐘，每隔15分鐘渦旋混勻一次，使DNA與磁珠結(jié)合。(3)45分鐘孵育后，向15μL捕獲的DNA樣本中加入47℃預(yù)熱的1×清洗液I100μL。渦旋混勻10秒。將0.2mLPCR管中的全部組分轉(zhuǎn)入1.5mL離心管中。將1.5mL離心管置于磁力架上吸附磁珠，棄上清。(4)將1.5mL離心管從磁力架上取下，加入200μL預(yù)熱47℃的1×漂洗液。吸打混勻10次(需迅速操作，防止試劑、樣品溫度低于47℃)?；靹蚝髽颖局糜?7℃加熱模塊上5分鐘。重復(fù)此步驟，用47℃的1×漂洗液共洗滌兩次。將1.5mL的離心管置于磁力架上，吸附磁珠，棄上清。(5)向上述1.5mL離心管中加入200μL室溫的1×清洗液I，渦旋混勻2分鐘。將離心管置于磁力架上，吸附磁珠，棄上清。向上述1.5mL離心管中加入200μL室溫的1×清洗液Ⅱ，渦旋混勻1分鐘。將離心管置于磁力架上，吸附磁珠，棄上清。向上述1.5mL離心管中加入200μL室溫的1×清洗液Ⅲ，渦旋混勻30秒。將離心管置于磁力架上，吸附磁珠，棄上清。(6)1.5mL離心管從磁力架上取下，加入45μLPCR水，溶解洗脫磁珠捕獲樣本。1.9捕獲DNA的PCR擴(kuò)增(1)按下表制備捕獲后PCRmix，制備好后渦旋震蕩混勻。富集引物F和富集引物R均購(gòu)自英濰捷基公司。(2)磁珠吸附DNAPCR的擴(kuò)增程序設(shè)定如下：(3)雜交捕獲DNAPCR產(chǎn)物的回收純化：用核酸純化磁珠回收純化反應(yīng)體系中的DNA，磁珠使用量為0.9×，純化后的文庫(kù)溶于30μL的ddH2O中。1.10文庫(kù)定量對(duì)文庫(kù)進(jìn)行2100BioAnalyzer(Agilent)/LabChipGX(Caliper)及QPCR檢測(cè)，記錄文庫(kù)濃度。1.11文庫(kù)上機(jī)測(cè)序構(gòu)建好的文庫(kù)采用NextSeq550AR進(jìn)行測(cè)序(PE75)。1.12數(shù)據(jù)處理及分析將獲得的測(cè)序數(shù)據(jù)輸入實(shí)施例1的裝置，檢測(cè)體細(xì)胞突變。檢測(cè)結(jié)果如下表所示。突變基因詳情突變頻率KITN822K，c.2466T>A20.9％1.13結(jié)果驗(yàn)證采用一代測(cè)序方法對(duì)同一患者骨髓樣本是否發(fā)生上述位點(diǎn)的體細(xì)胞突變進(jìn)行驗(yàn)證，檢測(cè)結(jié)果表明，KIT基因發(fā)生N822K，c.2466T>A的突變，缺失頻率約20％，驗(yàn)證結(jié)果與1.12檢測(cè)結(jié)果一致。本發(fā)明的檢測(cè)裝置能夠成功檢出血液樣本中血液病相關(guān)的體細(xì)胞突變。實(shí)施例3對(duì)一例慢性淋巴細(xì)胞白血病(CLL)患者的骨髓樣本進(jìn)行體細(xì)胞突變檢測(cè)。使用過膜法提取骨髓樣本基因組DNA，具體步驟參照天根公司血液/細(xì)胞/組織基因組DNA提取試劑盒操作手冊(cè)。檢測(cè)結(jié)果如下表所示。突變基因詳情突變頻率TP53S46fs，c.137_144del54％采用一代測(cè)序方法對(duì)同一患者剩余骨髓樣本是否發(fā)生上述位點(diǎn)的體細(xì)胞突變進(jìn)行驗(yàn)證，檢測(cè)結(jié)果表明TP53基因發(fā)生S46fs，c.137_144del的缺失，缺失頻率約50％，驗(yàn)證結(jié)果與上表的檢測(cè)結(jié)果一致。本發(fā)明的檢測(cè)裝置能夠成功檢出骨髓樣本中血液病相關(guān)的體細(xì)胞突變。工業(yè)實(shí)用性根據(jù)本發(fā)明，提供了一種能夠更準(zhǔn)確地區(qū)分測(cè)序錯(cuò)誤與真實(shí)SNV、從而更準(zhǔn)確地利用血液樣本檢測(cè)SNV的裝置及方法。當(dāng)前第1頁(yè)1 2 3

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳玥蘢;侯光遠(yuǎn);李停;方真;劉偉;玄兆伶;李大為;梁峻彬;陳重建
技術(shù)所有人：安諾優(yōu)達(dá)基因科技（北京）有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

體細(xì)胞相關(guān)技術(shù)

體細(xì)胞克隆相關(guān)技術(shù)

體細(xì)胞雜交相關(guān)技術(shù)

體細(xì)胞突變相關(guān)技術(shù)

體細(xì)胞高頻突變相關(guān)技術(shù)

體細(xì)胞突變和胚系突變相關(guān)技術(shù)

體細(xì)胞突變學(xué)說相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種用于檢測(cè)血液病相關(guān)體細(xì)胞突變的裝置的制作方法