子系統(tǒng)。
[0111] 圖8中顯示的子系統(tǒng)經(jīng)由系統(tǒng)總線875互連。顯示額外子系統(tǒng),諸如打印機874、 鍵盤878、一個(或多個)存儲設(shè)備879、監(jiān)視器876,其耦合至顯示適配器882和其他。耦 合至I/O控制器871的外圍設(shè)備和輸入/輸出(I/O)設(shè)備可以通過本領(lǐng)域中已知的任何數(shù) 目的方式(諸如串行端口 877)連接至計算機系統(tǒng)。例如,串行端口 877或外部接口 881 (例 如,以太網(wǎng)、Wi-Fi等)可用于將計算機系統(tǒng)800連接至廣域網(wǎng),諸如因特網(wǎng)、鼠標(biāo)輸入設(shè)備 或掃描儀。經(jīng)由系統(tǒng)總線875的互連允許中央處理器873與每個子系統(tǒng)通信,并且控制來 自系統(tǒng)存儲器872或存儲設(shè)備879(例如,硬盤)的指令的執(zhí)行,以及子系統(tǒng)之間的信息的 交換。系統(tǒng)存儲器872和/或存儲設(shè)備879可以具體化為計算機可讀介質(zhì)。本文提到的任 何值都可以是從一個組件至另一個組件的輸出,并且可以是給用戶的輸出。
[0112] 計算機系統(tǒng)可以包括多個相同的組件或子系統(tǒng),例如,通過外部接口 881或通過 內(nèi)部接口連接在一起。在一些實施方案中,計算機系統(tǒng)、子系統(tǒng)或設(shè)備可以經(jīng)網(wǎng)絡(luò)通信。在 此類情況下,一臺計算機可以被認(rèn)為是客戶端且另一臺計算機被認(rèn)為是服務(wù)器,其中每個 可以是相同的計算機系統(tǒng)的部分??蛻舳撕头?wù)器可以各自包括多個系統(tǒng)、子系統(tǒng)或組件。
[0113] 應(yīng)當(dāng)理解的是,本發(fā)明的任何實施方案可以以控制邏輯的形式使用硬件(例如, 應(yīng)用專用集成電路或現(xiàn)場可編程門陣列)和/或使用具有通??删幊烫幚砥鞯挠嬎銠C軟 件以模塊化或集成的方式來實施。如本文所使用,處理器包括相同集成芯片上的多核處理 器,或單個電路板上的或聯(lián)網(wǎng)的多個處理單元?;诒疚奶峁┑墓_和教導(dǎo),本領(lǐng)域普通技 術(shù)人員將知道且理解使用硬件和硬件與軟件的組合實施本發(fā)明的實施方案的其他方式和/ 或方法。
[0114] 本申請中描述的任何軟件組件或函數(shù)可以作為軟件代碼實施,所述軟件代碼通過 使用任何合適的計算機語言,諸如,例如Java、C++或Perl使用,例如,常規(guī)或面向?qū)ο蟮募?術(shù)由處理器來執(zhí)行。軟件代碼可以被存儲為用于存儲和/或傳輸?shù)挠嬎銠C可讀介質(zhì)上的一 系列指令或命令,合適的介質(zhì)包括隨機存取存儲器(RAM),只讀存儲器(R0M),磁性介質(zhì),諸 如硬盤-驅(qū)動器或軟盤,或光學(xué)介質(zhì),諸如光盤(CD)或DVD(數(shù)字多功能盤),閃存,等。計 算機可讀介質(zhì)可以是此類存儲或傳輸設(shè)備的任何組合。
[0115] 此類程序還可以編碼和使用適配于經(jīng)由符合各種方案的有線、光學(xué)和/或無線網(wǎng) 絡(luò)(包括因特網(wǎng))傳輸?shù)妮d波信號來傳輸。因此,根據(jù)本發(fā)明的實施方案的計算機可讀介 質(zhì)可以使用用此類程序編碼的數(shù)據(jù)信號來生成。用程序代碼編碼的計算機可讀介質(zhì)可以用 兼容設(shè)備包裝或由其他設(shè)備(例如,經(jīng)由因特網(wǎng)下載)分開提供。任何此類計算機可讀介 質(zhì)可以駐留在單個計算機程序產(chǎn)品(例如,硬盤驅(qū)動器、CD或整個計算機系統(tǒng))上或其中, 并且可以存在于系統(tǒng)或網(wǎng)絡(luò)內(nèi)的不同的計算機程序產(chǎn)品上或其中。計算機系統(tǒng)可以包括監(jiān) 示器、打印機或用于將任何本文提到的結(jié)果提供給用戶的其他合適的顯示器。
[0116] 任何本文描述的方法可以用包括一個或多個處理器(其可以被配置以執(zhí)行步驟) 的計算機系統(tǒng)完全或部分地進行。因此,實施方案可以涉及經(jīng)配置以進行本文描述的任何 方法的步驟的計算機系統(tǒng),其可能具有進行各步驟或各組步驟的不同的組件。盡管呈現(xiàn)為 編號的步驟,但本文方法的步驟可以同時或以不同順序來進行。此外,這些步驟的部分可以 用來自其他方法的其他步驟的部分來使用。而且,所有或部分步驟可以是任選的。此外,任 何方法的任何步驟可以用模塊、電路或用于進行這些步驟的其他方式來進行。
[0117] 具體實施方案的具體細節(jié)可以任何合適的方式組合,而不脫離本發(fā)明的實施方案 的精神和范圍。然而,本發(fā)明的其他實施方案可以涉及與每個個別方面或這些個別方面的 特定組合相關(guān)的特定實施方案。
[0118] 本發(fā)明的示例性實施方案的上述描述已經(jīng)出于說明和描述的目的來呈現(xiàn)。它不 期望是窮盡的或?qū)⒈景l(fā)明限定于所述精確形式,并且許多改變和變化鑒于上述教導(dǎo)是可能 的。選擇且描述實施方案以便最好地解釋本發(fā)明的原則和其實際應(yīng)用,進而使本領(lǐng)域技術(shù) 人員以各種實施方案和適用于考慮的具體應(yīng)用的各種改變來最好地利用本發(fā)明。
[0119] "一個/種(a)"、"一個/種(an)"或"該(the)"的記載旨在意指"一個/種或多 個/種",除非明確地相反指示。
【主權(quán)項】
1. 檢測生物的樣品基因組的目標(biāo)區(qū)域中的變體的方法,所述方法包括: -接收多個序列讀取值,所述序列讀取值獲得自測序獲得自所述生物的樣品中的基因 組區(qū)段,其中所述測序包括靶向來自所述目標(biāo)區(qū)域的基因組區(qū)段; -鑒定與參考基因組的目標(biāo)區(qū)域相比具有各自第一數(shù)目的變化的一個或多個替代區(qū) 域,每個各自第一數(shù)目大于一且小于第一閾值數(shù)目; -用計算機系統(tǒng)進行多個序列讀取值與參考基因組的目標(biāo)區(qū)域的比對,以鑒定與所述 參考基因組的目標(biāo)區(qū)域序列匹配且具有小于第二閾值數(shù)目的變化的序列讀取值的組; -從所述組中去除與替代區(qū)域之一序列匹配且具有小于第三閾值數(shù)目的第二數(shù)目的 變化的序列讀取值;和 -分析所述組的剩余序列讀取值以確定所述樣品基因組的目標(biāo)區(qū)域中的變體。2. 權(quán)利要求1的方法,其中靶向來自目標(biāo)區(qū)域的基因組區(qū)段包括使用經(jīng)設(shè)計以擴增所 述目標(biāo)區(qū)域的引物對來擴增基因組區(qū)段。3. 權(quán)利要求1的方法,其中靶向來自目標(biāo)區(qū)域的基因組區(qū)段包括使用錨定至表面的探 針以選擇來自所述目標(biāo)區(qū)域的基因組區(qū)段。4. 權(quán)利要求1的方法,其中所述第三閾值數(shù)目是所述替代區(qū)域的變化的相應(yīng)的第一數(shù) 目的一半。5. 權(quán)利要求1的方法,其中所述第三閾值數(shù)目為一。6. 權(quán)利要求1的方法,其中鑒定替代區(qū)域包括: -計數(shù)序列讀取值的數(shù)目,所述序列讀取值各自在相同的多個位置與所述參考基因組 的目標(biāo)區(qū)域不同,所述序列讀取值形成替代組; -如果所述數(shù)目超過截止值,則進行來自所述替代組的第一序列讀取值與所述參考基 因組的比對;和 -如果所述第一序列讀取值與所述參考基因組的第一區(qū)域的比對比與所述目標(biāo)區(qū)域 的比對具有更少的變化,則將所述第一區(qū)域鑒定為替代區(qū)域。7. 權(quán)利要求6的方法,其中所述替代組的序列讀取值在鄰近區(qū)域內(nèi)是相同的。8. 權(quán)利要求6的方法,其中用于鑒定所述第一區(qū)域的序列讀取值來自不同樣品的測 序。9. 權(quán)利要求6的方法,進一步包括: -將所述第一序列讀取值與所述目標(biāo)區(qū)域的已知突變的數(shù)據(jù)庫比較;和 -如果所述第一序列讀取值對應(yīng)于所述目標(biāo)區(qū)域的已知突變,則由于對應(yīng)于替代區(qū)域 而丟棄所述替代組。10. 權(quán)利要求1的方法,其中替代區(qū)域來自包括除了參考基因組以外的序列的序列數(shù) 據(jù)庫。11. 權(quán)利要求1的方法,其中分析所述組的剩余序列讀取值以確定所述樣品基因組的 目標(biāo)區(qū)域中的變體包括: -在所述目標(biāo)區(qū)域中的每個位置,計數(shù)與所述參考基因組不同的序列讀取值的數(shù)目。12. 權(quán)利要求1的方法,進一步包括: -針對一個或多個其他目標(biāo)區(qū)域重復(fù)所述方法。13. 權(quán)利要求12的方法,其中所述測序在測序兩個或更多個樣品的運行中進行,其中 所述基因組區(qū)段包括對應(yīng)于多個樣品中的一個樣品的ID,并且其中至少兩個樣品具有不同 的目標(biāo)區(qū)域。14. 權(quán)利要求12的方法,其中所述樣品具有第一目標(biāo)區(qū)域和第二目標(biāo)區(qū)域,并且其中 所述序列讀取值僅與所述第一目標(biāo)區(qū)域和所述第二目標(biāo)區(qū)域比對。15. 權(quán)利要求1的方法,其中所述替代區(qū)域來自不同的基因組。16. 權(quán)利要求1的方法,進一步包括: -通過以下將序列讀取值與替代區(qū)域比對: -鑒定所述替代區(qū)域和所述目標(biāo)區(qū)域之間的第一變化; -將所述序列讀取值與所述目標(biāo)區(qū)域比對,以鑒定所述序列讀取值和所述目標(biāo)區(qū)域之 間的第二變化;和 -將所述第一變化與所述第二變化比較。17. 計算機產(chǎn)品,其包括存儲多個指令的非臨時性計算機可讀介質(zhì),當(dāng)執(zhí)行時,所述指 令控制計算機系統(tǒng)以檢測生物的樣品基因組的目標(biāo)區(qū)域中的變體,所述指令包括: _接收多個序列讀取值,所述序列讀取值獲得自測序獲得自所述生物的樣品中的基因 組區(qū)段,其中所述測序包括靶向來自所述目標(biāo)區(qū)域的基因組區(qū)段; -鑒定與參考基因組的目標(biāo)區(qū)域相比具有各自第一數(shù)目的變化的一個或多個替代區(qū) 域,每個各自第一數(shù)目大于一且小于第一閾值數(shù)目; _進行多個序列讀取值與參考基因組的目標(biāo)區(qū)域的比對,以鑒定與參考基因組的目標(biāo) 區(qū)域序列匹配且具有小于第二閾值數(shù)目的變化的序列讀取值的組; -從所述組中去除與替代區(qū)域之一序列匹配且具有小于第三閾值數(shù)目的第二數(shù)目變 化的序列讀取值;和 -分析所述組的剩余序列讀取值以確定所述樣品基因組的目標(biāo)區(qū)域中的變體。18. 權(quán)利要求17的計算機產(chǎn)品,其中鑒定替代區(qū)域包括: -計數(shù)序列讀取值的數(shù)目,所述序列讀取值各自在相同的多個位置與所述參考基因組 的目標(biāo)區(qū)域不同,所述序列讀取值形成替代組; -如果所述數(shù)目超過截止值,則進行來自所述替代組的第一序列讀取值與所述參考基 因組的比對;和 -如果所述第一序列讀取值與所述參考基因組的第一區(qū)域的比對比與所述目標(biāo)區(qū)域 的比對具有更少的變化,則將所述第一區(qū)域鑒定為替代區(qū)域。19. 用于檢測生物的樣品基因組的目標(biāo)區(qū)域中的變體的系統(tǒng),所述系統(tǒng)包括: 一個或多個處理器,所述處理器經(jīng)配置以: _接收多個序列讀取值,所述序列讀取值獲得自測序獲得自所述生物的樣品中的基因 組區(qū)段,其中所述測序包括靶向來自所述目標(biāo)區(qū)域的基因組區(qū)段; -鑒定與參考基因組的目標(biāo)區(qū)域相比具有各自第一數(shù)目的變化的一個或多個替代區(qū) 域,每個各自第一數(shù)目大于一且小于第一閾值數(shù)目; _進行多個序列讀取值與參考基因組的目標(biāo)區(qū)域的比對,以鑒定與參考基因組的目標(biāo) 區(qū)域序列匹配且具有小于第二閾值數(shù)目的變化的序列讀取值的組; -從所述組中去除與替代區(qū)域之一序列匹配且具有小于第三閾值數(shù)目的第二數(shù)目的 變化的序列讀取值;和 -分析所述組的剩余序列讀取值以確定所述樣品基因組的目標(biāo)區(qū)域中的變體。20.權(quán)利要求19的系統(tǒng),進一步包括: -存儲與所述目標(biāo)區(qū)域相關(guān)的一個或多個替代區(qū)域的數(shù)據(jù)庫,其中所述一個或多個替 代區(qū)域的鑒定包括從所述數(shù)據(jù)庫檢索所述一個或多個替代區(qū)域。
【專利摘要】可以提供從靶向的測序程序獲得的測序讀取值的準(zhǔn)確且快速的定位。一旦選擇目標(biāo)區(qū)域,則可以鑒定與目標(biāo)區(qū)域足夠類似的基因組的替代區(qū)域。如果測序讀取值比替代區(qū)域更類似于目標(biāo)區(qū)域,則可以確定讀取值與目標(biāo)區(qū)域序列匹配。然后可以分析與目標(biāo)區(qū)域比對的讀取值以確定目標(biāo)區(qū)域中是否存在突變。因此,可以將測序讀取值與目標(biāo)區(qū)域和相應(yīng)的替代區(qū)域(而不是與整個基因組)比較,由此提供計算效率。
【IPC分類】G06F19/22
【公開號】CN104937598
【申請?zhí)枴緾N201380062074
【發(fā)明人】X.陳, Y.李, W-m.劉, X.(M.).馬, S-J.張
【申請人】霍夫曼-拉羅奇有限公司
【公開日】2015年9月23日
【申請日】2013年11月27日
【公告號】CA2891731A1, EP2926288A1, US20140149049, WO2014083023A1