本發(fā)明屬于基因分型診斷領(lǐng)域,具體涉及多發(fā)性肉芽腫血管炎及微小動(dòng)脈炎的基因分型診斷試劑盒及使用方法。
背景技術(shù):
抗中性粒細(xì)胞胞漿抗體(ANCA)相關(guān)小血管炎(ANCA Associated Vasculitis,AAV)包括肉芽腫性多血管炎(Granulomatosis with Polyangiitis,GPA)和微小動(dòng)脈炎(Microscopic Polyangiitis,MPA)。據(jù)報(bào)道,北京大學(xué)腎臟病研究所臨檢室在近5年新檢測(cè)出ANCA相關(guān)小血管炎1353例,說(shuō)明該類疾病在我國(guó)較為常見(jiàn)。目前ANCA是AAV疾病的主要血清學(xué)診斷指標(biāo),迄今尚無(wú)分子遺傳學(xué)診斷和區(qū)分GPA和MPA兩種疾病類型。
AAV疾病包括GPA和MPA兩種類型。目前對(duì)此類疾病的診斷包括血清學(xué)診斷、病理學(xué)診斷和影像學(xué)檢查。主要診斷依據(jù)是ANCA血清學(xué)檢查。c-ANCA多見(jiàn)于GPA,其靶抗原為蛋白酶3(PR3);p-ANCA主要見(jiàn)于MPA,其靶抗原為髓過(guò)氧化物酶(MPO)。統(tǒng)計(jì)數(shù)據(jù)表明:GPA病人疾病活動(dòng)期c-ANCA陽(yáng)性率達(dá)90%,非活動(dòng)期陽(yáng)性率只有60-70%,還有近10%的GPA病人p-ANCA陽(yáng)性。MPA病人疾病活動(dòng)期p-ANCA陽(yáng)性率60%,但也有近30%MPA病人c-ANCA陽(yáng)性。這些數(shù)據(jù)說(shuō)明ANCA血清學(xué)檢查的特異性偏低,不能準(zhǔn)確地區(qū)分GPA和MPA兩種疾病類型;而且其靈敏性和檢出率受疾病活動(dòng)狀態(tài)的影響較大,疾病活動(dòng)期病人陽(yáng)性率高,非活動(dòng)期病人陽(yáng)性率低。
技術(shù)實(shí)現(xiàn)要素:
為了克服上述缺陷,本發(fā)明提供多發(fā)性肉芽腫血管炎及微小動(dòng)脈炎的基因分型診斷試劑盒及使用方法,通過(guò)檢測(cè)與GPA和MPA相關(guān)5位SNP位點(diǎn)的特異性遺傳標(biāo)記物和疾病易感基因,對(duì)此類疾病進(jìn)行分子遺傳學(xué)分型以區(qū)分GPA和MPA兩類疾病,該檢測(cè)也可對(duì)攜帶易感基因的正常個(gè)體AAV發(fā)病風(fēng)險(xiǎn)進(jìn)行評(píng)估。本發(fā)明應(yīng)用HLA-DPB1等三個(gè)AAV相關(guān)基因設(shè)計(jì)應(yīng)對(duì)多發(fā)性肉芽腫血管炎和微小動(dòng)脈炎的分子診斷試劑盒,為國(guó)際上首例,具有良好的分子分型效能。
為了實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明所采用的技術(shù)方案為:多發(fā)性肉芽腫血管炎及微小動(dòng)脈炎的基因分型診斷試劑盒,其特征在于,包括肉芽腫性多血管炎基因和微小動(dòng)脈炎基因SNP檢測(cè)探針、多重PCR引物、多重PCR反應(yīng)液及雜交液與洗脫液。
包括四個(gè)小試劑盒,分別用于檢測(cè)位于HLA-DPB1基因上rs1042169_F、rs141520233_F和rs386699872_F的SNP位點(diǎn)以及HLA-DQA2基因上rs3998158_F的SNP位點(diǎn),每個(gè)小試劑盒內(nèi)裝有DNA抽提、PCR擴(kuò)增、限制性內(nèi)切酶酶切以及瓊脂糖凝膠電泳步驟的相關(guān)試劑。
所述試劑盒的HLA-DPB1和HLA-DQA2的擴(kuò)增引物序列以及對(duì)應(yīng)探針序列如下:
基因 檢測(cè)位點(diǎn) PCR擴(kuò)增正向引物PCR擴(kuò)增反向引物單堿基延伸引物
HLA-DPB1 rs1042169 5’-ACGTTGGATGACAGGATGTGCAGACACAAC-3’
5’-ACGTTGGATGAAAGCCCTCACTCACCTCG-3’5’-AGGGTCATGGGCCCG-3’
HLA-DPB1 rs141530233 5’-ACGTTGGATGGGATGTGCAGACACAACTAC-3’
5’-ACGTTGGATGAAAGCCCTCACTCACCTCG-3’5’-GCAGGGTCATGGGCC-3’
HLA-DPB1 rs386699872 5’-ACGTTGGATGACAGGATGTGCAGACACAAC-3’
5’-ACGTTGGATGAAAGCCCTCACTCACCTCG-3’5’-CGAGCTGGGCGGGCC-3’
HLA-DQA2 rs3998158 5’-ACGTTGGATGTTGTTTTCTCTGCTGCACTC-3’5’
-ACGTTGGATGAGCATCAGAGACATGTAGGC-3’5’-CTGCTGCACTCTTTATCC-3’。
一種多發(fā)性肉芽腫血管炎及微小動(dòng)脈炎的基因分型診斷試劑盒的使用方法,分別通過(guò)以下兩種方案多個(gè)步驟實(shí)現(xiàn):
方案一:經(jīng)典的Sanger法
1)擴(kuò)增反應(yīng)體系為:每50ul中含5ul的10倍擴(kuò)增緩沖液、2ul濃度為25mM的Mg2+、2ul濃度為I0mM的dNIPs、l.5ul濃度為10uM的正向引物、1.5ul濃度為10uM的反向引物、0.5ul的HotStarTaq DNA聚合酶、2ul濃度為10-20ng/ul的DNA模板、余量為35.5ul的加雙蒸水;
2)擴(kuò)增反應(yīng)步驟為:先95℃反應(yīng)15min,進(jìn)入循環(huán),循環(huán)中先94℃反應(yīng)0.5min,然后56℃反應(yīng)0.5min,然后72℃反應(yīng)1min為一個(gè)循環(huán),共反應(yīng)35個(gè)循環(huán)然后72℃反應(yīng)7min,最后4℃保存;
3)測(cè)序反應(yīng)體系為:4ul的BigdyeV3.1終結(jié)反應(yīng)混合物、3ul的雙蒸水、1ul濃度為10μΜ的測(cè)序引物、2ul的PCR產(chǎn)物;
4)測(cè)序反應(yīng)步驟為:先94℃反應(yīng)0.5min,然后50℃反應(yīng)0.5min,然后60℃反應(yīng)2.0min為一個(gè)循環(huán),共反應(yīng)30個(gè)循環(huán);
5)Sanger測(cè)序PCR反應(yīng)產(chǎn)物;
6)Sanger測(cè)序結(jié)果分析;
方案二:ARMS-PCR法
在多重PCR中同時(shí)擴(kuò)增多達(dá)4個(gè)含SNP的DNA片段;在單堿基延伸過(guò)程中,對(duì)多重PCR的純化產(chǎn)物進(jìn)行多重單堿基延伸,延伸引物在4個(gè)SNP處分別延伸一個(gè)核苷酸,使得所延伸的核苷酸類型,分別與SNP處的基因型相關(guān);單堿基延伸產(chǎn)生由延伸引物和延伸產(chǎn)物組成的待檢混合物,以質(zhì)譜對(duì)待檢混合物進(jìn)行檢測(cè),通過(guò)質(zhì)譜峰確定待檢混合物中各物質(zhì)分子量,并與預(yù)先計(jì)算的各延伸引物和延伸產(chǎn)物的理論分子量進(jìn)行比對(duì),從而確定待檢混合物是否包含特定的物質(zhì),進(jìn)而確定各SNP處的基因型;
聯(lián)合多重PCR擴(kuò)增引物和單堿基延伸包括:
基因 檢測(cè)位點(diǎn) PCR擴(kuò)增正向引物PCR擴(kuò)增反向引物單堿基延伸引物
HLA-DPB1 rs1042169 5’-ACGTTGGATGACAGGATGTGCAGACACAAC-3’
5’-ACGTTGGATGAAAGCCCTCACTCACCTCG-3’5’-AGGGTCATGGGCCCG-3’
HLA-DPB1 rs141530233 5’-ACGTTGGATGGGATGTGCAGACACAACTAC-3’
5’-ACGTTGGATGAAAGCCCTCACTCACCTCG-3’5’-GCAGGGTCATGGGCC-3’
HLA-DPB1 rs386699872 5’-ACGTTGGATGACAGGATGTGCAGACACAAC-3’
5’-ACGTTGGATGAAAGCCCTCACTCACCTCG-3’5’-CGAGCTGGGCGGGCC-3’
HLA-DQA2 rs3998158 5’-ACGTTGGATGTTGTTTTCTCTGCTGCACTC-3’
5’-ACGTTGGATGAGCATCAGAGACATGTAGGC-3’5’-CTGCTGCACTCTTTATCC-3’通過(guò)以下步驟實(shí)現(xiàn):
a.PCR擴(kuò)增和延伸反應(yīng)
1)通過(guò)多重PCR擴(kuò)增,獲得靶序列擴(kuò)增產(chǎn)物:分別在384孔里加入1μl基因組DNA(5ng/μl),4μl PCR反應(yīng)混合液。反應(yīng)條件為:94℃5min;94℃20sec,56℃30sec,72℃1min,45個(gè)循環(huán);72℃3min;
2)使用蝦堿性磷酸酶處理擴(kuò)增產(chǎn)物,除去擴(kuò)增產(chǎn)物中的dNTPs:在384孔中加入2μl SAP反應(yīng)混合液,進(jìn)行SAP反應(yīng),反應(yīng)條件為:37℃40min,85℃10min。反應(yīng)完成后降至室溫并4℃保存;
3)加入延伸引物進(jìn)行單堿基延伸反應(yīng),在延伸引物3’端連接一個(gè)與突變位點(diǎn)互補(bǔ)的堿基,獲得小片段單鏈延伸產(chǎn)物。在384孔中加入2μl單堿基延伸反應(yīng)液及適量引物,進(jìn)行單堿基延伸反應(yīng),反應(yīng)條件為:94℃15min;94℃20sec,56℃30sec,72℃1min,72℃3min;4℃保存;
b.產(chǎn)物純化和質(zhì)譜上機(jī)
1)使用陽(yáng)離子交換樹(shù)脂純化延伸產(chǎn)物,除去延伸產(chǎn)物的陽(yáng)離子。在384孔中加入16μl去離子水與6mg樹(shù)脂進(jìn)行脫鹽處理;
2)用基質(zhì)輔助激光解吸附/電離飛行時(shí)間質(zhì)譜技術(shù)(MALDI-TOF-MS)對(duì)純化后的產(chǎn)物進(jìn)行質(zhì)譜檢測(cè);
c.數(shù)據(jù)分析:使用MassARRAY Typer系統(tǒng)對(duì)HLA-DPB1三等位基因和HLA-DQA2等位基因信息進(jìn)行數(shù)據(jù)分析。
AAV是一種系統(tǒng)性自身免疫病,包括GPA和MPA兩種類型,其與ANCA存在密切相關(guān),是嚴(yán)重累及人類器官甚至威脅生命的壞死性血管炎。盡管GPA和MPA在通常情況下被認(rèn)為是同一種疾病,但它們?cè)谀承┓矫嬗忻黠@不同,例如細(xì)胞質(zhì)型抗體c-ANCA多見(jiàn)于GPA,其靶抗原為蛋白酶3(PR3)。細(xì)胞核周型抗體p-ANCA主要見(jiàn)于MPA,其靶抗原為髓過(guò)氧化物酶(MPO)。此外,GPA和MPA疾病的風(fēng)險(xiǎn)基因不同、主要受累器官不同、疾病復(fù)發(fā)風(fēng)險(xiǎn)不同以及臨床藥物治療和預(yù)后也不盡相同,因此臨床上迫切需要一種鑒別診斷技術(shù)對(duì)AAV進(jìn)行分子分型診斷。
通過(guò)對(duì)不同人群AAV患者大樣本進(jìn)行全基因組關(guān)聯(lián)分析(Genome wide Association Studies,GWAS),證明了此類疾病與主要組織兼容性復(fù)合體(Major Histocompatibility Complex,MHC)Class II等位基因有極高的相關(guān)性。GWAS研究證實(shí)SERPINA和PRTN3等位基因與AAV疾病有顯著相關(guān)性。與疾病的相關(guān)的MHC和非MHC風(fēng)險(xiǎn)基因在c-ANCA或p-ANCA陽(yáng)性的AAV病人中也顯著不同。以上結(jié)果為通過(guò)基因分型區(qū)分GPA和MPA奠定了基礎(chǔ)。因此我們建立了一個(gè)GPA和MPA疾病人群和健康人群數(shù)據(jù)庫(kù)。
我們通過(guò)對(duì)1986個(gè)AAV病人和4723個(gè)健康個(gè)體樣本的GWAS分析,發(fā)現(xiàn)多個(gè)與AAV疾病相關(guān)的錯(cuò)義和/或影響基因表達(dá)、參與免疫應(yīng)答的單核苷酸多態(tài)性(Single Nucleotide Polymorphism,SNP):包括MHC區(qū)域HLA-DP和HLA-DQ,以及非MHC區(qū)域的PRTN3、SERPINA1和PTPN22基因。MHC區(qū)域編碼HLA-DPβ鏈蛋白的HLA-DPB1基因單倍型與疾病的相關(guān)性最為顯著(rs141530233p=1.13x 10-89,OR=2.99)。非MHC區(qū)域易感基因SERPINA1和PTPN22的峰值信號(hào)來(lái)自影響基因功能的錯(cuò)義SNP rs28929474-(p=3.09x10-12,OR=2.18)和rs6679677(p=1.88x10-8,OR=1.40);而PRTN3的峰值信號(hào)來(lái)自基因上游調(diào)控區(qū)域SNP rs62132293(p=8.60x10-11,OR=1.29)。對(duì)AVV病人進(jìn)一步分組統(tǒng)計(jì)分析結(jié)果表明HLA-DPB1、PRTN3和SERPINA1與cANCA陽(yáng)性/GPA病人高度相關(guān),與pANCA陽(yáng)性/MPA病人沒(méi)有顯著相關(guān)性。而HLA-DQA2與pANCA陽(yáng)性/MPA病人有顯著相關(guān)性,與cANCA陽(yáng)性/GPA病人沒(méi)有顯著相關(guān)性。綜合本研究所有樣本的人口歸因分?jǐn)?shù)分析結(jié)果表明77%AAV病人歸因于上述所有易感基因。這些數(shù)據(jù)說(shuō)明AAV可以通過(guò)不同的功能性風(fēng)險(xiǎn)等位基因來(lái)進(jìn)行分類,并為不同疾病種類的區(qū)分和免疫功能紊亂的研究提供新途徑。
本發(fā)明與現(xiàn)有技術(shù)相比,具有以下有益效果:通過(guò)檢測(cè)與GPA和MPA相關(guān)5位SNP位點(diǎn)的特異性遺傳標(biāo)記物和疾病易感基因在血液細(xì)胞表達(dá)水平的變化,對(duì)此類疾病進(jìn)行分子遺傳學(xué)分型以區(qū)分GPA和MPA兩類疾病。并對(duì)攜帶易感基因的正常個(gè)體AAV發(fā)病風(fēng)險(xiǎn)進(jìn)行評(píng)估,具有良好的分子分型效能。
附圖說(shuō)明
圖1質(zhì)量控制和研究設(shè)計(jì)圖;
圖2對(duì)于全基因組關(guān)聯(lián)分析檢驗(yàn)統(tǒng)計(jì)量的位數(shù)-位數(shù)圖;
圖3為ANCA相關(guān)性血管炎全基因組關(guān)聯(lián)篩查的結(jié)果,Y軸表示沿著X軸的在每一個(gè)染色體的單核苷酸多態(tài)的–log10P值(來(lái)自EIGENSTRAT)。虛線表示全基因組顯著性閾值(P=5.0x10-7);
圖4通過(guò)直接測(cè)序分析確認(rèn)三等位基因HLA-DPB1風(fēng)險(xiǎn)和無(wú)風(fēng)險(xiǎn)單倍型,序列分析顯示HLA-DPB1外顯子2區(qū)rs1042169,rs141530233,rs386699872的風(fēng)險(xiǎn)和無(wú)風(fēng)險(xiǎn)的單倍型。通過(guò)引物對(duì)5’-GAGTACTGGAACAGCCAGAA和3’-TAAGGTCCCTTAGGCCAACC,一條從3048604到33048804的201bp的HLA-DPB1核苷酸片段被PCR擴(kuò)增,擴(kuò)增產(chǎn)物直接通過(guò)桑格測(cè)序確定純合子的風(fēng)險(xiǎn)(N=50)或純合非風(fēng)險(xiǎn)(N=50)rs1042169和rs141530233基因型,從每一個(gè)亞組讀出的序列的代表性的例子,與核苷酸序列和相應(yīng)的氨基酸序列和位置如圖所示。每個(gè)單倍型中的多態(tài)性等位基因盤旋。測(cè)序分析證實(shí)了rs386699872CA與風(fēng)險(xiǎn)100%的相關(guān)性,以及rs386699872G與無(wú)風(fēng)險(xiǎn)的rs1042169/rs141530233單倍型100%的相關(guān)性;
圖5為與AAV相關(guān)的rs62132293變異體與PRTN3表達(dá)的提高關(guān)聯(lián)示意圖,從有rs62132293CC(n=7),rs62132293CG(n=9)或者rs62132293GG(n=6)基因型的健康者的外周血單個(gè)核細(xì)胞中取出cDNA,對(duì)其進(jìn)行定量PCR的擴(kuò)增以檢測(cè)PRTN3mRNA的水平。相對(duì)于校準(zhǔn)參照基因COX5B PRTN3,PRTN3表達(dá)水平表示為在箱須圖上規(guī)范化的各個(gè)數(shù)據(jù)點(diǎn)。每個(gè)盒中的水平線表示了平均表達(dá)值;垂直線表示了最低和最高的數(shù)據(jù)點(diǎn)。數(shù)據(jù)代表了三次獨(dú)立實(shí)驗(yàn)。P值顯示配對(duì)t檢驗(yàn);
圖6 rs1042169等位基因與不同HLA-DPB1表達(dá)和T細(xì)胞表達(dá)相關(guān)聯(lián),(A)從具有rs1042169GG(N=13),rs1042169AA(N=7)或rs1042169GA(N=8)基因型的健康人外周血單個(gè)核細(xì)胞(PBMC)中提取cDNA,通過(guò)對(duì)它的擴(kuò)增可以檢測(cè)HLA-DPB1mRNA水平。數(shù)據(jù)為三次獨(dú)立實(shí)驗(yàn)的數(shù)據(jù)。(B,C)HLA-DP的B細(xì)胞(B)和單核細(xì)胞(C)的表面蛋白水平通過(guò)抗DP和抗CD19或抗CD14的流式細(xì)胞測(cè)定法評(píng)估了rs1042169GG抗體染色的PBMCs(24),rs1042169AA(N=5),或rs1042169GA(N=9)捐助者。黑色條表示平均MFI值。(D)用sense和anti-sense的PR3活化具有rs10421699GG(N=6),GA(N=4)或AA(N=2)基因型的PR3ANCA陽(yáng)性患者的外周血單個(gè)核細(xì)胞24個(gè)小時(shí),然后通過(guò)ELISPOT分析IFNγ分泌T細(xì)胞(數(shù)據(jù)表明活化與未活化細(xì)胞的平均倍數(shù)的變化)。條表示均值±SEM。P值為非配對(duì)t檢驗(yàn)所示。
具體實(shí)施方式
下面通過(guò)實(shí)施例對(duì)本發(fā)明作進(jìn)一步地說(shuō)明。
本發(fā)明提供的試劑盒是一種應(yīng)用于血管炎分型診斷的試劑盒。通過(guò)檢測(cè)AAV患者的特異性遺傳標(biāo)記物的變異以便在基因水平對(duì)GPA和MPA進(jìn)行遺傳學(xué)分型。并對(duì)攜帶易感基因的正常個(gè)體AAV發(fā)病風(fēng)險(xiǎn)進(jìn)行評(píng)估。
檢測(cè)試劑盒應(yīng)用于Sequenom iPLEX陣列平臺(tái)上,在Sequenom大規(guī)模陣列平臺(tái)上測(cè)定HLA-DPB1,HLA-DQA2基因位點(diǎn)上的4個(gè)SNP(表1)。
表1檢測(cè)ANCA相關(guān)性小血管炎相關(guān)基因HLA-DPB1及HLA-DQA2的引物設(shè)計(jì)及序列
實(shí)驗(yàn)方法
本發(fā)明設(shè)計(jì)的HLA-DPB1三等位基因和HLA-DQA2等位基因檢測(cè)PCR擴(kuò)增引物包括:
HLA-DPB1:5’-GAGTACTGGAACAGCCAGAA-3’
HLA-DPB1:3’-TAAGGTCCCTTAGGCCAACC-5’
HLA-DQA2:5’-TTTCTCTGCTGCACTCTTTATCC-3’
HLA-DQA2:3’-GGTCACAGGCAAATGCAGTA-5’
本發(fā)明設(shè)計(jì)的HLA-DPB1三等位基因檢測(cè)采用的測(cè)序引物包括:
HLA-DPB1:5’-GAGTACTGGAACAGCCAGAA-3’
HLA-DQA2:5’-TTTCTCTGCTGCACTCTTTATCC-3’
本發(fā)明通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn):
方案一:經(jīng)典的Sanger法
1)擴(kuò)增反應(yīng)體系為:每50ul中含5ul的10倍擴(kuò)增緩沖液、2ul濃度為25mM的Mg2+、2ul濃度為I0mM的dNIPs、l.5ul濃度為10uM的正向引物、1.5ul濃度為10uM的反向引物、0.5ul的HotStarTaq DNA聚合酶、2ul濃度為10-20ng/ul的DNA模板、余量為35.5ul的加雙蒸水。
2)擴(kuò)增反應(yīng)步驟為:先95℃反應(yīng)15min,進(jìn)入循環(huán),循環(huán)中先94℃反應(yīng)0.5min,然后56℃反應(yīng)0.5min,然后72℃反應(yīng)1min為一個(gè)循環(huán),共反應(yīng)35個(gè)循環(huán)然后72℃反應(yīng)7min,最后4℃保存。
3)測(cè)序反應(yīng)體系為:4ul的BigdyeV3.1終結(jié)反應(yīng)混合物、3ul的雙蒸水、1ul濃度為10μΜ的測(cè)序引物、2ul的PCR產(chǎn)物。
4)測(cè)序反應(yīng)步驟為:先94℃反應(yīng)0.5min,然后50℃反應(yīng)0.5min,然后60℃反應(yīng)2.0min為一個(gè)循環(huán),共反應(yīng)30個(gè)循環(huán)。
5)Sanger測(cè)序PCR反應(yīng)產(chǎn)物。
6)Sanger測(cè)序結(jié)果分析。
方案二:ARMS-PCR法
本發(fā)明設(shè)計(jì)還提供了一種聯(lián)合多重PCR技術(shù)、單堿基延伸技術(shù)和質(zhì)譜檢測(cè)技術(shù),檢測(cè)HLA-DPB1三等位基因和HLA-DQA2等位基因檢測(cè)方案。其中:在多重PCR中同時(shí)擴(kuò)增多達(dá)4個(gè)含SNP的DNA片段;在單堿基延伸過(guò)程中,對(duì)多重PCR的純化產(chǎn)物進(jìn)行多重單堿基延伸,延伸引物在4個(gè)SNP處分別延伸一個(gè)核苷酸,使得所延伸的核苷酸類型,分別與SNP處的基因型相關(guān);單堿基延伸產(chǎn)生由延伸引物和延伸產(chǎn)物組成的待檢混合物,以質(zhì)譜對(duì)待檢混合物進(jìn)行檢測(cè),通過(guò)質(zhì)譜峰確定待檢混合物中各物質(zhì)分子量,并與預(yù)先計(jì)算的各延伸引物和延伸產(chǎn)物的理論分子量進(jìn)行比對(duì),從而確定待檢混合物是否包含特定的物質(zhì),進(jìn)而確定各SNP處的基因型。
聯(lián)合多重PCR擴(kuò)增引物和單堿基延伸包括:
基因 檢測(cè)位點(diǎn) PCR擴(kuò)增正向引物PCR擴(kuò)增反向引物單堿基延伸引物
HLA-DPB1 rs1042169 5’-ACGTTGGATGACAGGATGTGCAGACACAAC-3’
5’-ACGTTGGATGAAAGCCCTCACTCACCTCG-3’5’-AGGGTCATGGGCCCG-3’
HLA-DPB1 rs141530233 5’-ACGTTGGATGGGATGTGCAGACACAACTAC-3’
5’-ACGTTGGATGAAAGCCCTCACTCACCTCG-3’5’-GCAGGGTCATGGGCC-3’
HLA-DPB1 rs386699872 5’-ACGTTGGATGACAGGATGTGCAGACACAAC-3’
5’-ACGTTGGATGAAAGCCCTCACTCACCTCG-3’5’-CGAGCTGGGCGGGCC-3’
HLA-DQA2 rs3998158 5’-ACGTTGGATGTTGTTTTCTCTGCTGCACTC-3’5’-ACGTTGGATGAGCATCAGAGACATGTAGGC-3’5’-CTGCTGCACTCTTTATCC-3’。
技術(shù)方案包括:
1.PCR擴(kuò)增和延伸反應(yīng)
1)通過(guò)多重PCR擴(kuò)增,獲得靶序列擴(kuò)增產(chǎn)物:分別在384孔里加入1μl基因組DNA(5ng/μl),4μl PCR反應(yīng)混合液。反應(yīng)條件為:94℃5min;94℃20sec,56℃30sec,72℃1min,45個(gè)循環(huán);72℃3min。5’端及3’端引物分別為1μg/mL。
2)使用蝦堿性磷酸酶處理擴(kuò)增產(chǎn)物,除去擴(kuò)增產(chǎn)物中的dNTPs:在384孔中加入2μl SAP反應(yīng)混合液,進(jìn)行SAP反應(yīng),反應(yīng)條件為:37℃40min,85℃10min。反應(yīng)完成后降至室溫并4℃保存。
3)加入延伸引物進(jìn)行單堿基延伸反應(yīng),在延伸引物3’端連接一個(gè)與突變位點(diǎn)互補(bǔ)的堿基,獲得小片段單鏈延伸產(chǎn)物。在384孔中加入2μl單堿基延伸反應(yīng)液及適量引物,進(jìn)行單堿基延伸反應(yīng),反應(yīng)條件為:94℃15min;94℃20sec,56℃30sec,72℃1min,72℃3min;4℃保存。
2.產(chǎn)物純化和質(zhì)譜上機(jī)
1)使用陽(yáng)離子交換樹(shù)脂純化延伸產(chǎn)物,除去延伸產(chǎn)物的陽(yáng)離子。在384孔中加入16μl去離子水與6mg樹(shù)脂進(jìn)行脫鹽處理。
2)用基質(zhì)輔助激光解吸附/電離飛行時(shí)間質(zhì)譜技術(shù)(MALDI-TOF-MS)對(duì)純化后的產(chǎn)物進(jìn)行質(zhì)譜檢測(cè)。
3.數(shù)據(jù)分析:使用MassARRAY Typer系統(tǒng)對(duì)HLA-DPB1三等位基因和HLA-DQA2等位基因信息進(jìn)行數(shù)據(jù)分析。
實(shí)驗(yàn)對(duì)象的選取
受試者均為AAV的患者,其中包括按風(fēng)濕病標(biāo)準(zhǔn)對(duì)肉芽腫性血管炎的分類修訂標(biāo)準(zhǔn)確診為肉芽腫性血管炎的患者(501個(gè)病例)。對(duì)照組樣本來(lái)自于1465個(gè)健康對(duì)照組。
基因分型和質(zhì)量控制方案
全基因組學(xué)關(guān)聯(lián)研究中共有1615份AAV病例的樣品和202個(gè)對(duì)照組在西奈山醫(yī)院臨床基因組學(xué)中心運(yùn)用Affymetrix Axiom Biobank 1基因分型陣列進(jìn)行了基因分型。該陣列測(cè)試了628,679個(gè)單核苷酸多態(tài)性,其中246,000個(gè)(36.5%)為全基因組學(xué)關(guān)聯(lián)標(biāo)記,265,000個(gè)(39.3%)為非同義編碼單核苷酸多態(tài)性,70,000個(gè)(10.4%)為無(wú)功能的單核苷酸多態(tài)性,23,000(3.4%)為表達(dá)數(shù)量形狀基因座(eQTL)單核苷酸多態(tài)性,還有2,000個(gè)(0.3%)為藥物遺傳學(xué)標(biāo)志,另外的27,679個(gè)是額外的“定制”的標(biāo)記(additional“custom”markers)。
基因分型首先使用Affymetrix Genotyping ConsoleTM 4.2software記錄下來(lái),隨后運(yùn)用Affymetrix的SNPolisher軟件進(jìn)行分析處理。所有的數(shù)據(jù)均采用Golden Helix SVS 8.3.4軟件進(jìn)行質(zhì)量檢測(cè),設(shè)置質(zhì)量標(biāo)準(zhǔn)為基因分型完成率大于95%和樣品完成率大于97%,且單態(tài)的單核苷酸多態(tài)性和哈迪-溫伯格平衡假定值小于10-5的SNP均會(huì)從數(shù)據(jù)集中刪除。篩選后,我們將兩個(gè)數(shù)據(jù)集中相同的單核苷酸多態(tài)性標(biāo)記合并到一個(gè)單獨(dú)的文件中。我們通過(guò)研究SNPs在連鎖不平衡中的出現(xiàn)的頻率來(lái)評(píng)測(cè)人群血統(tǒng)(IBD)和祖先,當(dāng)每對(duì)病例的IBD測(cè)量值大于0.25時(shí),移除其中低基因分型完成率的樣品。最終,通過(guò)質(zhì)量檢測(cè)的病例,對(duì)照組以及333,035個(gè)SNPs通過(guò)了質(zhì)量檢測(cè)(圖1)。A顯示了對(duì)單核苷酸多態(tài)性(SNP)和個(gè)體對(duì)象的基因組DNA基因分型的質(zhì)量控制的結(jié)果。單核苷酸多態(tài)性,以滿足質(zhì)量控制標(biāo)準(zhǔn)的要求:call rate大于95%,在哈迪-溫伯格平衡測(cè)試中P小于1×10-5大于0.01,最小等位基因頻率的測(cè)試中P大于0.01。B顯示了在發(fā)現(xiàn)(GWAS)和復(fù)制群組的病例和對(duì)照樣本的數(shù)量,并組合以產(chǎn)生一個(gè)薈萃分析數(shù)據(jù)集。
復(fù)制研究中我們將AAV病例和對(duì)照組中在Sequenom大規(guī)模陣列平臺(tái)上進(jìn)行iPLEX測(cè)定并在8個(gè)基因位點(diǎn)上對(duì)9個(gè)單核苷酸多態(tài)性進(jìn)行了基因分型。我們使用Taqman單核苷酸多態(tài)性基因分型陣列(Applied Biosystems)將另外一個(gè)在PRTN3位點(diǎn)上的單核苷酸多態(tài)性(rs62132293)進(jìn)行了基因分型,將質(zhì)量控制設(shè)置為單核苷酸多態(tài)性檢測(cè)率>95%和樣品完成率>97%。這個(gè)方法可以發(fā)現(xiàn)與亞組疾病有高度相關(guān)性的SNPs,如我們?cè)赑R3-ANCA和MPO-ANCA亞組的復(fù)制研究中發(fā)現(xiàn)了一個(gè)單核苷酸多態(tài)性(rs7264431)表現(xiàn)出與PR3-ANCA高度的相關(guān)性,另外則有兩個(gè)位于HLA-DQA1基因上的單核苷酸多態(tài)性表現(xiàn)出與MPO-ANCA高度的相關(guān)性,這次結(jié)果為我們?cè)O(shè)計(jì)AAV的基因分型提供了基礎(chǔ)。
統(tǒng)計(jì)方法
統(tǒng)計(jì)功效分析
我們使用Quanto v1.2.4software(http://hydra.usc.edu/gxe/)計(jì)算GWAS的功效,參數(shù)設(shè)置如下:GPA患病率:30/1,000,000;次要等位基因頻率:0.20;501個(gè)病例和1465個(gè)對(duì)照組;阿爾法(α):小于5.00x 10-8相當(dāng)于在全基因組學(xué)研究中具有顯著性水平,大于1.00x 10-4則認(rèn)為無(wú)明顯意義。對(duì)于α=5.00x 10-8或者α=0.0001,當(dāng)檢測(cè)關(guān)聯(lián)的相對(duì)風(fēng)險(xiǎn)分別大于1.4和大于1.3時(shí),效能評(píng)估分析為大于80%。在組合分析疾病病例和對(duì)照組樣本時(shí),α=5.00x 10-8,且p<0.0001,檢測(cè)SNP關(guān)聯(lián)相對(duì)風(fēng)險(xiǎn)小于1.25時(shí),效能依然被評(píng)估為大于80%。
關(guān)聯(lián)分析
我們采用EIGENSTRAT的方法進(jìn)行主成分分析,病例對(duì)照關(guān)聯(lián)研究使用1自由度的科克倫-曼特爾-亨塞爾測(cè)試來(lái)調(diào)整組間實(shí)驗(yàn)對(duì)象的分層并使用PLINKversion1.9進(jìn)行分層聚類。為了保證分析方法的可信度,在主成分分析的基礎(chǔ)上,我們調(diào)整了前三個(gè)特征向量進(jìn)行了關(guān)聯(lián)分析,在特征向量的調(diào)整前后顯示最小膨脹率的Lambda值分別為1.012和0.991(圖2)。在剔除沒(méi)有通過(guò)質(zhì)量控制的所有個(gè)體和單核苷酸多態(tài)性后,Y軸表示由EIGENSTRAT分析得到的–log10(p)值,X軸表示預(yù)計(jì)的–log10(p)值?;蚪M控制校正后,膨脹因子λ在特征向量調(diào)整前后是0.991與1.012。(A)–log10(p)值對(duì)于所有的GWAS SNPs。(B)在剔除HLA區(qū)域的SNPs后的–log10(p)值。
薈萃分析
采用Logistic回歸分析的結(jié)果和PLINK v1.9的薈萃分析功能的應(yīng)用來(lái)進(jìn)行兩個(gè)隊(duì)列的薈萃分析,并使用逆差額加權(quán)來(lái)合并多個(gè)研究以達(dá)到固定效應(yīng)分析。此外,我們采用類似比較等位基因頻率的的方法,通過(guò)比較GPA和MPA以及PR3與MPO對(duì)ANCA的反應(yīng)性來(lái)確定病例組之間是否存在差異。由于HLA區(qū)域的SNPs往往連鎖不平衡,我們采用Logistic回歸分析來(lái)評(píng)估SNPs在HLA區(qū)域中的作用、調(diào)節(jié)等位基因的相關(guān)性以獲得SNPs在不同區(qū)域發(fā)揮的作用。異質(zhì)性研究采用χ2科克倫的Q統(tǒng)計(jì)量進(jìn)行分析。
插補(bǔ)
我們采用software package IMPUTE 2v2.3.2和1000Genomes Project Phase 3在4629個(gè)樣本(已通過(guò)GWAS質(zhì)量控制標(biāo)準(zhǔn))中插補(bǔ)來(lái)自五大人群的2504個(gè)個(gè)體的全基因組序列數(shù)據(jù)(包含81,706,022SNPs,MNPs,插入和缺失)的額外SNPs到其全基因組數(shù)據(jù)中。在實(shí)施插補(bǔ)之前,我們從GWAS數(shù)據(jù)集中刪除了樣本檢測(cè)率低于95%的SNPs和P值低于10-5的數(shù)據(jù)。我們采用了千人基因組計(jì)劃(GP)第三階段(單倍體的發(fā)布時(shí)間為2014年10月)的1至22的染色體作為參考數(shù)據(jù)集,并使用千人基因組計(jì)劃第一階段(單倍體X染色體發(fā)布時(shí)間為2012年8月)的數(shù)據(jù)作為染色體X。運(yùn)用SHAPEIT(shapeit.v2.r790.Ubuntu_12.04.4.static)插補(bǔ)全基因組數(shù)據(jù)“兩步走”來(lái)推導(dǎo)分段基因型,并使用IMPUTEv2(impute_v2.3.2_x86_64_static)來(lái)執(zhí)行分段數(shù)據(jù)的插補(bǔ)。我們使用用于導(dǎo)出分段基因型的默認(rèn)參數(shù)以增加:i)優(yōu)化原迭代次數(shù);ii)優(yōu)化精簡(jiǎn)后的迭代次數(shù);iii)使用迭代數(shù)目計(jì)算單倍體概率我們使用的是~5Mb非重疊區(qū)間對(duì)全基因組進(jìn)行了插補(bǔ),并提供"-use_prephased_g"標(biāo)志以表明預(yù)分的單倍型正在被使用。此外,我們排除了千人基因組計(jì)劃內(nèi)歐洲人和東亞人中最小等位基因頻率低于0.001的變異體。使用選項(xiàng)"-pgs_miss"將被插補(bǔ)的基因型替換掉為分類SNPs中缺失的基因型。當(dāng)插補(bǔ)缺失基因型達(dá)到800("-k_hap 800")時(shí),參考單倍體將作為模板使用,且緩沖區(qū)域?qū)⒃黾拥?00kb("-buffer 500")。
在精細(xì)作圖的區(qū)域,我們用IMPUTEv2插入了非基因分型數(shù)據(jù)但是沒(méi)有為了提高插補(bǔ)精度在SHAPEIT中預(yù)調(diào)相。為此我們還增加了i)馬爾科夫鏈蒙特卡洛(MCMC)迭代(包括burn-in)到50("-iter 50")的默認(rèn)號(hào)碼,ii)MCMC迭代次數(shù)15("-burnin 15"),以及iii)當(dāng)觀察到基因型調(diào)相到100("-k 100")時(shí),作為模板的單倍體數(shù)量。
條件分析
基因分型/補(bǔ)差PTPN22,PRTN3,SERPINA1和HLA等位基因的條件分析被進(jìn)行測(cè)試在區(qū)域內(nèi)的多個(gè)獨(dú)立效果。我們首先使用了邏輯回歸框架來(lái)測(cè)試各等位基因之間的關(guān)聯(lián)性,包括作為人口分層中協(xié)變量的前3個(gè)主成分。在識(shí)別一個(gè)最顯著的標(biāo)記之后,我們通過(guò)包含第一標(biāo)記的用量作為一個(gè)協(xié)變量來(lái)測(cè)試其他額外協(xié)變量的獨(dú)立影響。重復(fù)這個(gè)過(guò)程,調(diào)節(jié)所有獨(dú)立的顯著SNPs直到標(biāo)記全基因組中的顯著信號(hào)。同時(shí)我們對(duì)PLINK v1.9進(jìn)行條件分析與基因分型數(shù)據(jù),并進(jìn)行SNPTEST v2.5.2分析與填補(bǔ),并對(duì)所有的標(biāo)記使用SAS version 9.2的proc logistic模塊共同分析,以獲得優(yōu)勢(shì)比。
人群歸因分?jǐn)?shù)
在摻入多變量的SNPs Logistic回歸模型中取比值比(ORs),用于評(píng)估人群歸因分?jǐn)?shù)(PAF),調(diào)節(jié)每個(gè)SNP的比值比。通過(guò)這些分析,我們建立了一套評(píng)估單一位點(diǎn)等位基因效應(yīng)的人群歸因分?jǐn)?shù)(PAF):
在此公式中,OR是與等位基因型相關(guān)聯(lián)的比值比,PAF是風(fēng)險(xiǎn)變異體的等位基因的頻率。
若用于多個(gè)位點(diǎn)的計(jì)算,這個(gè)公式則變成:
隨機(jī)森林分析
我們應(yīng)用機(jī)器學(xué)習(xí)工具來(lái)評(píng)估等位基因組合的潛在作用可能對(duì)AAV帶來(lái)的風(fēng)險(xiǎn)。首先,我們運(yùn)用分類和回歸樹(shù)(CART)方法學(xué)去執(zhí)行隨機(jī)森林分析,分類樹(shù)尋求評(píng)估可用數(shù)據(jù)的所有可能的分裂,來(lái)確定更準(zhǔn)確的病例和對(duì)照組分離的關(guān)節(jié)點(diǎn),從而通過(guò)logistic回歸或者用其他統(tǒng)計(jì)模型選擇過(guò)程搜索其他很難確定的變量組合。然而,分類樹(shù)可能會(huì)過(guò)度擬合數(shù)據(jù),因此我們需要首先使用一個(gè)隨機(jī)森林的方法來(lái)減少需要考慮的變量數(shù)目。簡(jiǎn)要來(lái)說(shuō),呈現(xiàn)在表1中的10個(gè)變異體的數(shù)據(jù)取決于分類分析和用70%的樣品和變量重復(fù)建立的回歸樹(shù),以及用于分類剩余的30%的數(shù)據(jù)。這一分析的結(jié)果表明PTPN22和其中一種HLADQA2(rs7454108)變異體基本不能改善病例和對(duì)照的分類,然而其他變異體(rs9277341in HLA-DPA1,rs141530233in HLA-DPB1,rs1042169in HLA-DPB1,rs62132293in PRTN3,rs35242582in SERPINA1,rs104902in HLA-DQB1,and rs39981589in HLA-DQA2)都至少提高了3%的模型擬合,并且將全部數(shù)據(jù)保留下來(lái)并構(gòu)建了最終的分類和回歸樹(shù)。隨后我們用這些基因變異體來(lái)執(zhí)行最終的CART分析。我們使用software program rpart和Gini index measure來(lái)確定數(shù)據(jù)的最佳分割,并設(shè)定復(fù)雜參數(shù)為0.001。僅這一部分中我們就精簡(jiǎn)至少20個(gè)觀察對(duì)象,最終模型有73%的分類精度。
驗(yàn)證位點(diǎn)的功能注釋
為了篩選候選基因和候選基因變異體,我們采用PICS算法(概率識(shí)別因果SNP)并以PICS概率>0.0275來(lái)識(shí)別風(fēng)險(xiǎn)基因變異體(http://www.broadinstitute.org/pubs/finemapping/?q=pics)。閾值的采用與Farh etc.論文中描述的方法是一致的。然后我們用ENSEMBL Variant Predictor網(wǎng)絡(luò)工具來(lái)注釋這些變異體,并預(yù)測(cè)其功能(http://www.ensembl.org/info/docs/tools/vep/index.html)。我們采用Genevar(ref),seeQTL(http://www.bios.unc.edu/research/genomic_software/seeQTL/)(ref)和芝加哥大學(xué)eQTL瀏覽器(http://eqtl.uchicago.edu/cgi-bin/gbrowse/eqtl/)在候選變種之間識(shí)別表達(dá)數(shù)量性狀位點(diǎn)(eQTLs)。
定量PCR
外周血單核細(xì)胞(PBMC)和多形核白細(xì)胞通過(guò)Ficoll-Hypaque密度離心后使用氯化銨裂解緩沖液出去紅細(xì)胞。RNA通過(guò)使用TRIzol(Invitrogen)和Direct-zol RNA MiniPrep試劑盒(Zymo)萃取,全過(guò)程均在無(wú)RNase條件下操作。逆轉(zhuǎn)錄實(shí)驗(yàn)使用500ng全RNA,并加入隨機(jī)六聚體引物和SuperScriptIII逆轉(zhuǎn)錄酶(Invitrogen)。使用SYBR green和以下被驗(yàn)證為線性放大和通過(guò)測(cè)序表明可得到單一產(chǎn)物的引物對(duì)定量PCR(qPCR)進(jìn)行檢測(cè):PRTN3(forward:ACAACTACGACGCGGAGAAC;reverse:ACGGAGGCACTGAGGTTG),COX5B(forward:ACTGGGTTGGAGAGGGAGAT;reverse:TGGAGATGGAGGGGACTAAA),HLA-DPB1(forward:CAGCCTGGATAGTCCTGTCA;reverse:ATGCCCACTCCACAGATGAT),and GAPDH(forward:ATGTTCGTCATGGGTGT GAA;reverse:GGTGCTAAGCAGTTGGTGGT).)樣品在ABI PRISM 7900HT序列檢測(cè)系統(tǒng)(Applied Biosystems)中跑樣,與使用2(ΔΔCt)公式計(jì)算內(nèi)部相關(guān)的特定基因(COX5B for PRTN3and GAPDH for HLA-DPB1)的倍數(shù)變化。
流式細(xì)胞分析
通過(guò)Ficoll-Hypaque密度離心從全血中提取PBMCs,將其用PE-抗人CD19抗體(BD Biosciences)或APC-Cy7-抗人CD14抗體(BD Biosciences)的推薦濃度進(jìn)行染色,同時(shí)與FITC-抗人HLA-DP(Leinco)抗體或與FITC-鼠抗人IgG(BD Biosciences)的同型對(duì)照抗體在室溫下培養(yǎng)45分鐘,洗滌,然后使用FACS Canto(BD Biosciences)流式細(xì)胞儀讀取樣本并用FlowJo軟件進(jìn)行數(shù)據(jù)分析。
酶聯(lián)免疫測(cè)定實(shí)驗(yàn)
患者組和健康對(duì)照組的PBMCs重懸于含20%FBS的RPMI培養(yǎng)基中,接種2x105細(xì)胞在預(yù)涂有抗人IFN-γ的單克隆抗體(eBioscience)的ELISPOT板上(96孔、PVDF膜)。細(xì)胞在37℃用10μg/ml的多肽或1μg/ml的ConA(Sigma)刺激24小時(shí)后,將板清洗,并將留于板中的細(xì)胞與生物素化的小鼠抗人IFN-γ抗體(eBioscience),抗生物素蛋白HRP(eBioscience)和AEC溶液(BDTM ELISPOT)在使用濃度培養(yǎng)適宜時(shí)間后使用Immunospot reader(ImmunoSpot 3software,version 3.2;Cellular Technology Ltd,Cleveland,OH,USA)讀取結(jié)果。
表2:復(fù)制研究和結(jié)合性關(guān)聯(lián)分析的結(jié)果
CI=置信區(qū)間;A del=腺苷缺失;OR=比值比;RAF=風(fēng)險(xiǎn)等位基因頻率
a Eigenstrat Pvalue,b PLINK Pvalues,c Pvalues用于綜合GWAS分析,結(jié)合等位基因頻率計(jì)數(shù)的科克倫-曼特爾-亨塞爾法被用于復(fù)制數(shù)據(jù)集的計(jì)算,d rs141530233是一個(gè)插入/缺失多態(tài)性,在核苷酸33048688位置上,風(fēng)險(xiǎn)基因型缺失腺苷殘基,無(wú)風(fēng)險(xiǎn)基因型包含腺苷殘基。
我們發(fā)現(xiàn)的與AAV疾病高度相關(guān)的易感基因和風(fēng)險(xiǎn)等位基因,包括MHC區(qū)域的HLA-DP基因、HLA-DQ基因和非MHC區(qū)域PRTN3、SERPINA1、PTPN22基因。其中HLA-DPB1、PRTN3和SERPINA1基因與cANCA陽(yáng)性/GPA病人高度相關(guān),與pANCA陽(yáng)性/MPA病人沒(méi)有顯著相關(guān)性。而HLA-DQA2基因與pANCA陽(yáng)性/MPA病人有顯著相關(guān)性,與cANCA陽(yáng)性/GPA病人沒(méi)有顯著相關(guān)性。因此,本發(fā)明擬采用基因檢測(cè)方法檢測(cè)AAV疾病GPA和MPA兩種類型分別所特有的易感基因遺傳標(biāo)記物,通過(guò)HLA-DP三等位基因、PRTN3和SERPINA1等位基因來(lái)鑒定AAV疾病GPA類型,通過(guò)HLA-DQA2等位基因鑒定AAV疾病MPA類型。本基因檢測(cè)方法特異性強(qiáng)和準(zhǔn)確性高、靈敏性和檢出率不受到疾病活動(dòng)狀態(tài)影響,可以從分子遺傳學(xué)上明確地區(qū)分GPA和MPA兩類疾病。
以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出:對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和等同形式的替換,這些改進(jìn)和等同替換得到的技術(shù)方案也應(yīng)屬于本發(fā)明的保護(hù)范圍。