亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于基因型鑒定結核分枝桿菌的引物、snp標記及方法_3

文檔序號:9277913閱讀:來源:國知局
。W國際標準流程進行間格區(qū)寡核巧酸分型及MIRU-VNTR 基因型鑒定。共156株分離株(包括北京、EAI、化arlem、LAM、T、MANU及其它未分類菌株) 用于后續(xù)分析,所示分離株具有可用的所有基因分型數(shù)據(jù)。
[014引 MTB菌株之基因組測序
[0149] 六株MTB菌株;胖6、]\0、]\17、427、418及124分別屬于基因群現(xiàn)代北京、化31'1日111、拉 了美洲-地中海(LAM)、T、東非-印度(EAI)及古代北京。它們代表分離自S個不同臺灣 族群之臨床菌株之主要類型,并W454焦磯酸測序法進行全基因組測序(MarguliesMet 31.,化1:腳6 2005, 437 (7057): 376-380)。利用GenomeSequencer20 (GS-20)或Genome SequencerFLX(GS-FL幻儀器(454LifeSciences,Roche)W14-28 倍基因組深度對TB菌 株分別進行測序,對各菌株用500-800堿基對之鳥槍文庫。
[0150] WNexteraDM樣品制備試劑盒(Illumina,CA,USA)制備六個MTB化arlem及六 個T臨床分離株之DM文庫,并使用HiSeq2000測序儀于流通槽的一條通道進行多重測序 (2xl00bp)。進行去多重(de-multiplex)程序后,各樣品之平均序列大小為3. 38抓,且當定 位(ma卵ing)于冊7Rv參考序列時,該等樣品之深度范圍為568至1068倍,因此,該等樣品 之參考覆蓋度為99. 44%至99. 82%。
[0151] 定位于H37RV參考序列
[0152] 將來自各菌株之454測序原始數(shù)據(jù)(sff文件)收集至一特定文件夾作為讀取來 源,W與參考菌株冊7Rv之基因組進行比對。冊7Rv基因組序列及已經(jīng)注釋之基因信息均 可由MicrobialGenomeAssembly/AnnotationProjects的NCBIftp站(site) , (ftp: // ftp,ncbi.nih.gov/genomes/Bacteria/MvcobacteriumtuberculosisH37Rvuid57777/) 下載。454GSReferenceMapper(Roche)軟件(2. 3版)系用W將454讀取定位于該參考序 列(詳細信息如表2所示);并于參考菌株和六個MTB臨床菌株之間產生高信賴度變異。
[0153] 表2、品系特異性之單核巧酸多態(tài)性(SN巧之統(tǒng)計
[0154]
[0巧日]菌株特異性之SNP的選擇
[0156] W結果為基礎,所述結果含有與至少=個非二重復讀取之"高信賴度"差異,所述 讀?。╝)顯示該等差異,化)在該差異之兩側均具有至少五個堿基,(C)于該讀取中具有少 數(shù)其它分離之序列差異,及(d)于正向具有至少一比對點(aligned)且于反向具有至少一 比對點。另外,只有在所有六個菌株中具有至少=個被覆蓋之讀取,且變異率高于或等于 80%的那些變異位點被視為有效。W自制底稿化ome-madescripts)將全部六個菌株之定 位結果合并,并將該等有效變異置入MyS化數(shù)據(jù)庫中進行進一步分析。選擇具菌株特異性 (僅見于單一菌株中)的SNP,并分成兩類;PE/PPE蛋白質家族及非PE/PPE。依據(jù)該變異之 位置,它們可與編碼序列為同義或非同義。且于非PE/PPE組中,該等變異亦可位于非編碼 序列,此為基因間區(qū)域。為了WMassARRAY分析儀(購自Sequenom)進一步確認,W各變異 點之全深度及變異深度均高于15且變異頻率必須高于90%之標準減少變異之數(shù)量。
[0157] 對于IlluminaHiSeq2000 測序數(shù)據(jù)之SNP召喚(SNPcalling),系使用化C GenomicsWor化ench軟件(Aarhus,Denmark)W默認參數(shù)分析各樣品之定位序列數(shù)據(jù)。我 們應用額外濾器W鑒定具有高于30倍深度及>95 %變體頻率之高度可信之SNP。
[015引 WMassArray系統(tǒng)為基礎之SNP基因型鑒定
[0巧9]使用MassArrayAssayDesi即 3. 1 軟件(Sequenom,SanDiego,CA)設計用于 60 個陽/P陽及60個隨機選擇的非陽/P陽之SNP之PCR及延伸引物,其中五個因序列艱困而 被排除。PCR系于384孔平盤中進行,每孔體積加l,lpmol之對應引物,5ng之基因組DNA 及HotStarreactionMix(Qiagen)。每種樣品需要S孔。PCR條件如下;94°C為 15min, 接著為94°C(20s)、56°C(30s)、72°C(60s)之40個循環(huán),及最終延伸為72°C3min。于引 物延伸流程中,各樣品系W94°C變性,接著為94°C(5s)、52°C(5s)、72°C巧S)之40個循 環(huán)。WMassARRAY質譜儀(購自Sequenom)揃取由時間解析光譜所得之質譜,各光譜接著 WSpectroTYP邸軟件(Sequenom)分析W進行基因型召喚。分析該基因型譜后,五個SNP 之分簇模式無法用于正確執(zhí)行基因型召喚,且最終在后續(xù)分析中使用110個SNP(57個PE/ P陽及53個非陽/PP巧之數(shù)據(jù)。
[0160] 連鎖不平衡及系統(tǒng)發(fā)生分析
[0161] 如圖2所示,Whaploview軟件為基礎,使用LewontinD'測量W評估該連鎖不平 衡(LD)之標記間系數(shù)。W額外嚴格標準,即各對標記之間為r2 = 1,從110個SNP中選出 25個ta拆NP。WSNP數(shù)據(jù)應用化ylip軟件計算根井距離,接著W鄰接法構建系統(tǒng)發(fā)生樹。
[0162] 結果
[0163] 六株MTB臨床分離株之基因組測序
[0164] 選擇品系特異性DNA標記之整體方案系如流程圖(圖1)所示?;谖覀兿惹皩τ?臺灣MTB菌株之研究值OU,etal),我們選擇代表性菌株進行全基因組測序。該等細菌之起 始分組系W間格區(qū)寡核巧酸分型及MIRU為基礎,我們還考慮感染該等MTB之患者之族群背 景。我們采用454技術W全基因組鳥槍法產生高覆蓋度序列。將該代表性菌株之基因組序 列與參考菌株比較,W產生各分離株之變體序列。W總數(shù)120個的SNP形成一基因型鑒定 面板,用W研究150個額外的臨床分離株,該等分離株已利用間格區(qū)寡核巧酸分型及MIRU 兩者鑒定過。在系統(tǒng)發(fā)生分析及決定樹之分析后,將該等156個分離株化+150)W所選標 記分群。為了改善該基因型鑒定面板并擴展選擇品系特異性SNP之基礎,將無法W最小化 之SNP標記組分類者進一步測序。接著將該測序數(shù)據(jù)用于比較性分析,W將該流程精細化。 為了獲得來自當?shù)刈迦褐硇訫TB菌株之基因組內容,且解析它們與參考菌株H37RV之 相異處,我們W454平臺對六個分離株進行全基因組鳥槍測序。將S個分離株W6、M3、M7藉 由454GS20測序儀W96堿基對之平均讀取長度進行測序。隨著測序技術進展,將另外S個 分離株A27、A18、M24藉由454FLX測序儀W較長的平均讀取長度227堿基對及較少測序實 驗運行次數(shù)進行測序。該等測序深度于454GS20數(shù)據(jù)中為約14X~23X,而于454FLX數(shù)據(jù) 中為約16X~28X。
[0165] 該定位結果總結于表3。六個分離株均得到至少95. 8%之定位的讀取,覆蓋該參 考序列之97%及W上。W454GS20測序之S個分離株之片段重迭數(shù)為214~305,而W 454FLX測序之S者則為290~299。W454GS20測序之S個分離株之較大片段重迭(〉= 1,OOObp)之數(shù)量為134~158,而W454FLX測序之S者則為196~200,表示W(wǎng)454FLX測 序之S個分離株之較大片段重迭比率較高。于該六個分離株中,較大片段重迭之化red分 數(shù)40及W上(Q40Bases)之堿基質量為99. 48%至99. 95%,表示該測序質量夠高。
[0166] 表3、六株MTB臨床分離株之基因組測序及比對結果
[0167]
[0168] $深度=總堿基/冊7Rv基因組長度
[0169] *大重疊:重疊長度〉=lOOObp
[0170] avg重疊尺寸&N50重疊尺寸從大重疊計算用454gsMapperRelease:2. 3計算
[017。 該等MTB臨床分離株之基因變異
[0172] 由該六個分離株之定位結果,共取得9, 003個高信賴度(肥)變異(關于肥變體 之定義,請參見方法章節(jié)),包括SNP、多核巧酸多態(tài)性(MNP)、插入及缺失(IN呢L)。W至 少一個分離株具有超過80%之變異頻率,且依標準序列位置將該等變異進行排列后,共有 3, 819個參考位置是該六個分離株均有至少S個讀取覆蓋的。為了簡化,選擇僅含有SNP之 3, 582個參考位置進行后續(xù)分析(其它27個位置為IN呢L且210個位置為MNP)。
[0173] 于該等3,582個5^中,404個5^共存于所有六個分離株中,且分別有13、19、 232、538個SNP共存于所述六個分離株的五個、四個、S個及兩個中(詳見表4)。最豐富的 SNP為2, 376菌株特異性者(HC差異僅存在于該六個菌株的一個中),我們用其作為尋找品 系特異性SNP之候選者。該等候選SNP依照其在編碼區(qū)或非編碼區(qū)的位置而分為S種主要 類型;PE/PPE基因家族、非PE/PPE基因家族、及基因間SNP(如表2所示)。針對位于編碼 區(qū)之該等SNP,除了M7分離株W外,非同義SNP相較于同義SNP似乎具有更多或同等數(shù)量。 如我們所知,該兩種新基因家族PE/PPE之存在系包含約10%之TB基因組之編碼能力,因 此PE/PPE家族中的SNP數(shù)量一般會大幅少于位于其它非PE/PPE基因家組中者。A18 (屬 于EAI品系)的特異性SNP數(shù)量,系高于其它五個分離株4~10倍,推測該品系可能具有 較高突變率,可快速適應其宿主環(huán)境之改變。
[0174] 表4、各菌株之各位置之全深度^ 3且變異率^ 80%之高信賴度SNP
[0175]
[0176] 156個結核分枝桿菌臨床分離株之SNP基因型鑒定
[0177] 為了表征用于系統(tǒng)發(fā)生分析的156個臨床分離株之SNP,選出具有高信賴度分數(shù) 之120個品系特異性SNP,設計用于SequenomMassArray分析的引物。該120個品系特異 性SNP不均等地選自如表5所示的六個品系樣品,此系因在該等樣品之間的品系特異性SNP 總數(shù)不同所致。將該120個品系特異性SNP分成兩類;[引PE/PPE基因家族中的60個SNP 全部;[引非PE/PPE基因家族的1,215個非同義SNP中的60個(詳如表6所示)。120個 SNP中有5個,因為GC含量過高和/或引物二聚體,而無法于Seauenom甚質輔巧激化解吸 由離飛行時間質譜(MALDI-T0F)系統(tǒng)中設計引物。120個SNP中的115個被設計成10個 多重反應,并于156個臨床結核分枝桿菌分離株中進行基因型鑒定。我們排除了召喚率低 (<95% )且分簇模式差的五個SNP,其余110個SNP則用于后續(xù)分析。與Sequenom及454 巧。序數(shù)據(jù)比較,假陽性及假陰性率均為0%,且于156個樣品中之該110個SNP各自的平均 召喚率為97%。基于如圖2所示的連鎖不平衡分析,于MTB基因組中的該等SNP之間具有 很強的關聯(lián)性。該110個品系特異性SNP由25ta拆NPWr2 = 1進行完全標簽(tag)。
[0178] 表5、用于菌株分型之品系特異性SNP之選擇
[0179]
[0180] 表6、用于SequenomMassArray之基因型鑒定面板之SNP數(shù)
[0181]
[0182] MTB分離株之系統(tǒng)發(fā)生及分群分析
[0183] 為了追蹤156個臨床分離株之間的關系,W110-SNP或25-ta拆NP信息為基礎而 構建系統(tǒng)發(fā)生樹,如圖3 (A)及3炬)所示。該110-SN
當前第3頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1