亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一組地理特異性的間日瘧原蟲分子標(biāo)記及其在蟲株溯源中的應(yīng)用的制作方法

文檔序號:509102閱讀:327來源:國知局
一組地理特異性的間日瘧原蟲分子標(biāo)記及其在蟲株溯源中的應(yīng)用的制作方法
【專利摘要】本發(fā)明涉及一組地理特異性的間日瘧原蟲分子標(biāo)記及其在蟲株溯源中的應(yīng)用。具體地,所述的分子標(biāo)記包含反映對不同媒介按蚊感染性差異的間日瘧原蟲環(huán)子孢子蛋白中央重復(fù)區(qū);反映突變、遷移及遺傳漂變的高度多態(tài)性微衛(wèi)星;以及反映藥物防治對種群陽性選擇的抗藥性相關(guān)基因突變,結(jié)果表明,間日瘧原蟲環(huán)子孢子蛋白中央重復(fù)區(qū)序列、二氫葉酸還原酶SNP、二氫蝶呤合成酶SNP、中性微衛(wèi)星等分子標(biāo)記均具有地理特異性,可作為溯源檢測的分類指標(biāo)。
【專利說明】一組地理特異性的間日瘧原蟲分子標(biāo)記及其在蟲株溯源中的應(yīng)用
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于生物技術(shù)和分子生物學(xué)領(lǐng)域,具體地,本發(fā)明涉及一組地理特異性的間日瘧原蟲分子標(biāo)記及其在蟲株溯源中的應(yīng)用。
【背景技術(shù)】
[0002]瘧疾是人類疾病中最古老的傳染病之一,至今仍嚴(yán)重影響人類健康。據(jù)世界衛(wèi)生組織(WHO)發(fā)布的《2011年世界瘧疾報告》,全球每年約有2.16億瘧疾病例,死亡人數(shù)約為65.5萬。盡管近十年瘧疾死亡率已下降25%,但抗藥性瘧原蟲傳播、人員交流頻繁、全球氣候變暖等因素均威脅著來之不易的抗瘧成就。
[0003]在我國,四十年瘧疾防治工作成效卓越,流行區(qū)范圍大幅縮小,發(fā)病人數(shù)與死亡報告數(shù)大幅減少。但近年,一些地區(qū)瘧疾疫情出現(xiàn)了回升或局部暴發(fā)的趨勢。如黃淮流域地區(qū)疫情一直處于不穩(wěn)定狀態(tài),安徽、河南、湖北和江蘇等省出現(xiàn)了疫情回升或局部瘧疾暴發(fā)的趨勢;如云南省邊境地區(qū)輸入性瘧疾持續(xù)增高,死亡病例多為境外勞務(wù)歸國人員。這些疫情變化對我國按期實現(xiàn)《中國消除瘧疾行動計劃》提出嚴(yán)峻挑戰(zhàn)。
[0004]如期實現(xiàn)消除瘧疾的目標(biāo),需要解決的關(guān)鍵問題之一是理解瘧原蟲種群遺傳結(jié)構(gòu),即定義種群的多樣性、分布和動力學(xué)特征等。由于流行程度、媒介蚊種、人類活動(防治措施)及其他環(huán)境影響,不同地區(qū)瘧原蟲種群均有差異。當(dāng)前,國際國內(nèi)人員流動日益頻繁,輸入性瘧疾病例屢見不鮮;同時,周邊國家如緬甸、泰國等瘧疾疫情不容樂觀,隨時存在因輸入性傳染源造成本地傳播的潛在危險。發(fā)現(xiàn)瘧原蟲地理特異性分子標(biāo)記、建立溯源系統(tǒng),在監(jiān)測瘧疾控制區(qū)、追溯疫情暴發(fā)區(qū)疫源,及預(yù)防國際交往可能帶來的高毒力或高抗性蟲株輸入流行等方面,都具有`重要的應(yīng)用價值。
[0005]在從控制走向消除瘧疾的過程中,我國不斷調(diào)整防治策略和技術(shù)措施。瘧疾病原追蹤溯源技術(shù)作為關(guān)鍵技術(shù)難題之一,已納入國家科研攻關(guān)范疇,它將為中國消除瘧疾行動計劃的順利實施提供技術(shù)保障。
[0006]研究已表明,瘧原蟲株的地理分布決定于其生物學(xué)特性、生態(tài)環(huán)境條件的變化和人類防治措施的影響。我國學(xué)者通過實驗感染發(fā)現(xiàn)中國南北各地普遍存在潛伏期長短可變并具有遠期復(fù)發(fā)特征的間日瘧原蟲株;應(yīng)用間日瘧環(huán)子孢子蛋白基因分型法發(fā)現(xiàn)我國間日瘧原蟲可區(qū)分為具有明顯地理分布特征的溫帶族、熱帶族和PV2型3大類群;應(yīng)用裂殖子表面蛋白I基因分型法發(fā)現(xiàn)我國南北等位基因型分布存在差異。但僅憑氣候、媒介按蚊或地理分隔等單因素分析種群分化差異,難以得到準(zhǔn)確的溯源結(jié)果。
[0007]傳統(tǒng)的種群結(jié)構(gòu)研究多采用針對裂殖子表面抗原I和2 (MSP-1和MSP-2)基因、谷氨酸富集蛋白(GLURP)、環(huán)子孢子表面蛋白(CSP)等的分型方法,但這類編碼抗原的基因多態(tài)性往往受免疫選擇壓力影響?,F(xiàn)今廣泛應(yīng)用于瘧原蟲種群遺傳學(xué)研究的分子標(biāo)志主要為微衛(wèi)星(microsatellite)及單核苷酸多態(tài)性(Singlenucleotide polymorphism, SNP)等。以微衛(wèi)星或SNP為分子標(biāo)志的分子遺傳學(xué)研究現(xiàn)已進行了十年,發(fā)現(xiàn)了一些種群分離現(xiàn)象,但至今未有建立病原溯源檢測系統(tǒng)。主要原因在于種群分離受自然選擇、遺傳漂變、遷移、突變、隔離等多重因素影響,單一指標(biāo)往往難以全面反映流行地區(qū)蟲株的種群遺傳特征。
[0008]因此,本領(lǐng)域迫切需要確立地理特異性的間日瘧原蟲遺傳分子標(biāo)記,并建立溯源系統(tǒng)。

【發(fā)明內(nèi)容】

[0009]本發(fā)明的目的就是提供一組地理特異性的間日瘧原蟲分子標(biāo)記及其在蟲株溯源中的應(yīng)用。
[0010]在本發(fā)明的第一方面,提供了一種間日瘧原蟲分子標(biāo)記的用途,所述的間日瘧原蟲分子標(biāo)記選自下組:
[0011](I)環(huán)子孢子蛋白中央重復(fù)區(qū)中第7、第8、第10、或第14個九肽重復(fù)序列;
[0012](2) 二氫葉酸還原酶核苷酸序列中第171、第174、或第182位SNP位點;
[0013](3) 二氫蝶呤合成酶核苷酸序列中第1461、或第1971位SNP位點;
[0014](4) 3.35中性微衛(wèi)星、9-AT中性微衛(wèi)星、或12.335中性微衛(wèi)星;
[0015](5)上述任意組合;
[0016]它們被:
[0017](a)用作間日瘧原蟲蟲株的地理溯源的分子標(biāo)記,或用作間日瘧原蟲地理特異性分類的分子標(biāo)記;或
[0018](b)用于制備進行間日瘧原蟲蟲株的地理溯源分析的試劑盒或試劑,或用于制備對間日瘧原蟲進行地理特異性分類的試劑盒或試劑。
[0019]在另一優(yōu)選例中,所述的地理溯源是指:檢測間日瘧原蟲蟲株的地理來源。
[0020]在另一優(yōu)選例中,所述的間日瘧原蟲蟲株的地理來源選自:海南、云南、或華中。
[0021]在另一優(yōu)選例中,所述的華中包括(但不限于):河南、安徽、湖南。
[0022]在另一優(yōu)選例中,所述的用途還包括選自下組的一個或多個特征:
[0023](i)所述的環(huán)子孢子蛋白的編碼基因全序列如SEQ ID NO:1所示;
[0024](ii)所述的二氫葉酸還原酶核苷酸序列如SEQ ID NO:2所示;
[0025](iii)所述的二氫蝶呤合成酶核苷酸序列如SEQ ID NO:3所示。
[0026]在另一優(yōu)選例中,所述的用途還包括選自下組的一個或多個特征:
[0027](i)所述的間日瘧原蟲分子標(biāo)記為:環(huán)子孢子蛋白中央重復(fù)區(qū)中第7、第8、第10以及第14個九肽重復(fù)序列的組合;
[0028](ii)所述的間日瘧原蟲分子標(biāo)記為:二氫葉酸還原酶核苷酸序列中第171、第174、第182位SNP位點,以及二氫蝶呤合成酶核苷酸序列中第1461、第1971位SNP位點的
組合;
[0029](iii)所述的間日瘧原蟲分子標(biāo)記為:3.35中性微衛(wèi)星、9-AT中性微衛(wèi)星、以及
12.335中性微衛(wèi)星的組合;
[0030]在另一優(yōu)選例中,所述的間日痕原蟲分子標(biāo)記為:
[0031]環(huán)子孢子蛋白中央重復(fù)區(qū)中第7、第8、第10以及第14個九肽重復(fù)序列;二氫葉酸還原酶核苷酸序列中第171、第174、第182位SNP位點,以及二氫蝶呤合成酶核苷酸序列中第1461、第1971位SNP位點;3.35中性微衛(wèi)星、9-AT中性微衛(wèi)星、以及12.335中性微衛(wèi)星的所有組合。
[0032]在本發(fā)明的第二方面,提供了一種對待檢測的間日瘧原蟲蟲株樣本進行地理溯源或地理特異性分類的方法,包括步驟:
[0033](Al)對待檢測的間日瘧原蟲樣本,檢測下述分子標(biāo)記:
[0034](I)環(huán)子孢子蛋白中央重復(fù)區(qū)中第7、第8、第10、或第14個九肽重復(fù)序列;
[0035](2) 二氫葉酸還原酶核苷酸序列中第171、第174、或第182位SNP位點;
[0036](3) 二氫蝶呤合成酶核苷酸序列中第1461、或第1971位SNP位點;
[0037](4) 3.35中性微衛(wèi)星、9-AT中性微衛(wèi)星、或12.335中性微衛(wèi)星;
[0038](5)上述任意組合;
[0039](BI)對所述分子標(biāo)記檢測結(jié)果進行分析判定,基于以下一個或多個標(biāo)準(zhǔn)進行地理溯源或地理特異性分類:
[0040]在待檢測的間日瘧原蟲樣本中,如果:
[0041]環(huán)子孢子蛋白中央重復(fù)區(qū)中第7個九肽重復(fù)序列為⑶RADGQAA,則判定所述的間日瘧原蟲來源于華中;
[0042]或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第8個九肽重復(fù)序列為GNGAGGQPAJl^IjSK述的間日瘧原蟲來源于華 中;
[0043]或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第10個九肽重復(fù)序列為⑶GAAGQPA,則判定所述的間日瘧原蟲來源于華中;
[0044]或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第14個九肽重復(fù)序列為GNGAGGQPA,則判定所述的間日瘧原蟲來源于華中;
[0045]或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第7個九肽重復(fù)序列為⑶RAAGQPA,,則判定所述的間日瘧原蟲來源于海南;
[0046]或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第8個九肽重復(fù)序列為⑶RAAGQPAJl^IjSK述的間日瘧原蟲來源于海南;
[0047]或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第10個九肽重復(fù)序列為⑶RAAGQPA,則判定所述的間日瘧原蟲來源于海南;
[0048]或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第14個九肽重復(fù)序列為⑶RAAGQPA,則判定所述的間日瘧原蟲來源于海南;
[0049]或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第14個九肽重復(fù)序列為GNGAGGQPA,則判定所述的間日瘧原蟲來源于海南;
[0050]或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第7個九肽重復(fù)序列為⑶RAAGQPAJl^IjSK述的間日痕原蟲來源于云南;
[0051]或,如果環(huán)子孢子蛋中央重復(fù)區(qū)中第8個九肽重復(fù)序列為⑶RAAGQPA,并則判定所述的間日痕原蟲來源于云南;
[0052]或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第10個九肽重復(fù)序列為⑶RAAGQPA,則判定所述的間日痕原蟲來源于云南;
[0053]或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第14個九肽重復(fù)序列為⑶RADGQPA,則判定所述的間日痕原蟲來源于云南;[0054]或,如果二氫葉酸還原酶核苷酸序列中第171、第174、或第182位SNP位點、或二氫蝶呤合成酶核苷酸序列中第1461、或第1971位SNP位點發(fā)生突變,則判定所述的間日瘧原蟲來源于云南;
[0055]或,如果二氫葉酸還原酶核苷酸序列中第174位SNP位點發(fā)生突變,則所述的間日瘧原蟲來源于海南;
[0056]或,如果二氫蝶呤合成酶核苷酸序列中第1971位SNP位點發(fā)生突變,則判定所述的間日瘧原蟲來源于海南;
[0057]或,如果3.35中性微衛(wèi)星中AT重復(fù)單元為9次,則判定所述的間日瘧原蟲來源于華中;
[0058]或,如果3.35中性微衛(wèi)星中AT重復(fù)單元為9或10次,則判定所述的間日瘧原蟲來源于海南;
[0059]或,如果3.35中性微衛(wèi)星中AT重復(fù)單元為9、11或13次,則判定所述的間日瘧原蟲來源于云南;
[0060]或,如果9-AT中性微衛(wèi)星中AT重復(fù)單元為5次,則判定所述的間日瘧原蟲來源于華中;
[0061]或,如果9-AT中性微衛(wèi)星中AT重復(fù)單元為5、17或19次,則判定所述的間日瘧原蟲來源于海南;
[0062]或,如果9-AT中性微衛(wèi)星中AT重復(fù)單元為28或30次,則判定所述的間日瘧原蟲來源于云南;
[0063]或,如果12.33`5中性微衛(wèi)星中AT重復(fù)單元為10次,則判定所述的間日瘧原蟲來源于華中;
[0064]或,如果12.335中性微衛(wèi)星中AT重復(fù)單元為10或11次,則判定所述的間日瘧原蟲來源于海南;
[0065]或,如果12.335中性微衛(wèi)星中AT重復(fù)單元為11次,則判定所述的間日瘧原蟲來
源于云南。
[0066]在另一優(yōu)選例中,所述的方法還包括步驟(Cl):
[0067](Cl)對判定結(jié)果進行匯總,其中,
[0068]當(dāng)采用多個標(biāo)準(zhǔn)得出的判定結(jié)果一致時,則匯總為該一致結(jié)果;
[0069]當(dāng)采用多個標(biāo)準(zhǔn)得出的判定結(jié)果不一致但存在優(yōu)勢判定結(jié)果時,則匯總為該優(yōu)勢判定結(jié)果;
[0070]當(dāng)采用多個標(biāo)準(zhǔn)得出的判定結(jié)果不一致且不存在優(yōu)勢判定結(jié)果時,則再測量步驟(A)中所述的其他分子標(biāo)記并進行判定;或基于步驟⑶中其他標(biāo)準(zhǔn)進行判定,并再次進行匯總分析。
[0071]在本發(fā)明的第三方面,提供了一種對待檢測的間日瘧原蟲蟲株樣本進行地理溯源或地理特異性分類的方法,包括步驟:
[0072](A2)對待檢測的間日瘧原蟲樣本,檢測下述分子標(biāo)記:
[0073](I)環(huán)子孢子蛋白中央重復(fù)區(qū)中第7、第8、第10、或第14個九肽重復(fù)序列;
[0074](2) 二氫葉酸還原酶核苷酸序列中第171、第174、或第182位SNP位點;
[0075](3) 二氫蝶呤合成酶核苷酸序列中第1461、或第1971位SNP位點;[0076](4) 3.35中性微衛(wèi)星、9_AT中性微衛(wèi)星、或12.335中性微衛(wèi)星;
[0077](5)上述任意組合;
[0078](B2)對所述分子標(biāo)記檢測結(jié)果進行分析判定:
[0079]當(dāng)對一待檢測樣本檢測了 η個分子標(biāo)記時,分別確定η個分子標(biāo)記檢測結(jié)果在華中、云南和海南的虛擬積分Cn、Yn、Hn,其中η為大于I的正整數(shù)(如1_30),并計算三種虛擬積分之和,SCi, ΣΥ?, ΣΗ?,其中 i = 1-η ;
[0080]其中所述虛擬積分Cn、Yn、Hn為所述分子標(biāo)記η在華中、云南和海南間日瘧原蟲中出現(xiàn)頻率;
[0081](C2)比較Cn、Yn和Hn,從而得出最大值,并將對待檢測的間日瘧原蟲蟲株樣本的地理溯源或地理特異性分類為最大值所對應(yīng)的地理區(qū)域。
[0082]在另一優(yōu)選例中,在步驟(B2)中,分子標(biāo)記在華中、云南和海南間日瘧原蟲中的出現(xiàn)頻率如表2 —表9所示。
[0083]在另一優(yōu)選例中,所述的二氫葉酸還原酶核苷酸序列中第171、第174、或第182位SNP位點,或二氫蝶呤合成酶核苷酸序列中第1461、或第1971位SNP位點是指:
[0084]二氫葉酸還原酶核苷酸序列中第171位SNP由C突變?yōu)锳或G、第174位SNP由C突變?yōu)镚、第182位SNP由C突變?yōu)門 ;以及二氫蝶呤合成酶核苷酸序列中第1461位SNP由C突變?yōu)镚、第1971位SNP由C突變?yōu)镚。
[0085]在另一優(yōu)選例中,本發(fā)明方法是非診斷性方法。
[0086]在本發(fā)明的第四方面,提供了一種對間日瘧原蟲蟲株樣本進行地理溯源或地理特異性分類的試劑盒,所述的試劑盒包括選`自下組的試劑:
[0087](I)用于檢測環(huán)子孢子蛋白中央重復(fù)區(qū)中第7、第8、第10、或第14個九肽重復(fù)序列的試劑;
[0088](2)用于檢測二氫葉酸還原酶核苷酸序列中第171、第174、或第182位SNP位點的試劑;
[0089](3)用于檢測二氫蝶呤合成酶核苷酸序列中第1461、或第1971位SNP位點;
[0090](4)用于檢測3.35中性微衛(wèi)星、9-AT中性微衛(wèi)星、或12.335中性微衛(wèi)星的試劑;
[0091](5)上述試劑的任意組合;和
[0092]使用說明書。
[0093]較佳地,所述說明書描述了本發(fā)明第二方面或第三方面中所述的方法。
[0094]應(yīng)理解,在本發(fā)明范圍內(nèi)中,本發(fā)明的上述各技術(shù)特征和在下文(如實施例)中具體描述的各技術(shù)特征之間都可以互相組合,從而構(gòu)成新的或優(yōu)選的技術(shù)方案。限于篇幅,在
此不再一一累述。
【具體實施方式】
[0095]本發(fā)明人經(jīng)過廣泛而深入的研究,首次提供了一組能夠綜合反映間日瘧原蟲地域來源和種群特征的分子標(biāo)記組,它包含反映對不同媒介按蚊感染性差異的間日瘧原蟲環(huán)子孢子蛋白中央重復(fù)區(qū);反映突變、遷移及遺傳漂變的高度多態(tài)性微衛(wèi)星;以及反映藥物防治對種群陽性選擇的抗藥性相關(guān)基因突變。結(jié)果表明,間日瘧原蟲環(huán)子孢子蛋白中央重復(fù)區(qū)序列、二氫葉酸還原酶SNP、二氫蝶呤合成酶SNP、中性微衛(wèi)星等分子標(biāo)記均具有地理特異性,可作為溯源檢測的分類指標(biāo)。在此基礎(chǔ)上完成了本發(fā)明。
[0096]術(shù)語
[0097]如本文所用,術(shù)語“間日瘧原蟲環(huán)子孢子蛋白中央重復(fù)區(qū)”和“PvCSP九肽重復(fù)序列”可互換使用,都是指間日瘧原蟲環(huán)子孢子蛋白中央重復(fù)區(qū)內(nèi)的九肽重復(fù)序列。優(yōu)選地,具有地理特異性的九肽重復(fù)序列僅指PvCSP中央重復(fù)區(qū)中第7、8、10、14四個九肽重復(fù)序列。編碼間日瘧原蟲環(huán)子孢子蛋白的全部核苷酸序列見SEQ ID N0:1。
[0098]如本文所用,術(shù)語“二氫葉酸還原酶”與“DHFR”可互換使用,編碼間日瘧原蟲二氫葉酸還原酶的全部核苷酸序列見SEQ ID N0:2。
[0099]如本文所用,術(shù)語“二氫蝶呤合成酶”與“DHPS”可互換使用,編碼間日瘧原蟲二氫蝶呤合成酶的全部核苷酸序列見SEQ ID N0:3。
[0100]如本文所用,術(shù)語“二氫葉酸還原酶和二氫蝶呤合成酶的點突變”和“DHFR和DHPS的單核苷酸多態(tài)性”等可互換使用,都指間日瘧原蟲二氫葉酸還原酶和二氫蝶呤合成酶上的核苷酸變異,也可包括相應(yīng)的氨基酸變異。優(yōu)選地,具有地理特異性的僅指DHFR中第171、174、182 位 SNP 和 DHPS 中第 1461、1971 位 SNP。
[0101]本發(fā)明的三個地理種群特異的分子標(biāo)記涉及一個間日瘧基因的中央重復(fù)區(qū),即環(huán)子孢子蛋白中央重復(fù)區(qū)。環(huán)子孢子蛋白由兩個種間保守區(qū)和一段中央重復(fù)區(qū)組成,中央重復(fù)區(qū)及重復(fù)后區(qū)存在明顯的地理變異。瘧原蟲與本地蚊媒的相對適應(yīng)性能夠解釋蚊媒感染瘧原蟲及蚊媒傳瘧能力在種間或同種不同基因型間的差異。本發(fā)明結(jié)果顯示:華中地區(qū)樣本與云南海南樣本在中央重復(fù)區(qū)九肽重復(fù)單位的組成及排列上差異明顯。
[0102]本發(fā)明的地理種群特異的分子標(biāo)記還涉及兩個間日瘧原蟲葉酸拮抗劑抗性相關(guān)基因,即二氫葉酸還原酶與二氫蝶呤合成酶。葉酸拮抗劑類藥物如乙胺嘧啶/磺胺多辛的抗藥性機制與其作用靶酶二氫葉酸還原酶或二氫蝶呤合成酶基因的點突變相關(guān)。前期研究結(jié)果表明,我國瘧原蟲長期處于乙胺嘧啶或乙胺嘧啶/磺胺多辛的藥物選擇壓力下,且各地理種群表現(xiàn)為不同的單核苷酸多態(tài)性和單倍型。
[0103]檢測間日瘧原蟲地理種群特異的分子標(biāo)記,可以由PCR擴增再測序獲得PvCSP中央重復(fù)區(qū)序列,可以由PCR擴增再測序獲得DHFR和DHPS基因中的單核苷酸多態(tài)性,也可以由毛細管電泳檢測微衛(wèi)星片段長度,然后將其分子特征(九肽重復(fù)序列類型、SNP位點類型、微衛(wèi)星長度多態(tài)性)代入數(shù)據(jù)集。
[0104]本發(fā)明不僅包括具體的九肽重復(fù)單位和SNP位點,還包括具有特異性的擴增引物和測序引物,如 P0F/P0R、PBF/PAF、DHPS-F1/DHPS-R1、DHPS-F2/DHPS-R2、、CSP-ffF, CSP-WR、T-CS-F, T-CS-R (詳見實施例)。
[0105]本發(fā)明的各分子標(biāo)記檢測可由本領(lǐng)域內(nèi)技術(shù)人員通過擴增,測序,長度測定等技術(shù)實現(xiàn)。通過PCR擴增從基因組模板中獲得特異性好產(chǎn)量佳的產(chǎn)物,通過測序測定包含目標(biāo)核苷酸或重復(fù)單位的核苷酸序列,通過毛細管電泳檢測微衛(wèi)星片段的長度多態(tài)性。這些技術(shù)均是本領(lǐng)域內(nèi)技術(shù)人員所熟知的。
[0106]如本文所用,術(shù)語“WEKA”是一款基于JAVA環(huán)境下開源的機器學(xué)習(xí)以及數(shù)據(jù)挖掘軟件。 [0107] 如本文所用,術(shù)語“分類模型”指從一個已分類的、具備一定規(guī)則的樣本集中進行對未來樣本的分類。[0108]如本文所用,術(shù)語“支持向量機”是指數(shù)據(jù)挖掘方法的一種,是建立在統(tǒng)計學(xué)VC維理論和結(jié)構(gòu)風(fēng)險最小原理基礎(chǔ)上的,根據(jù)有限的樣本信息在模型的復(fù)雜性(即對既定訓(xùn)練樣本的學(xué)習(xí)精度)和學(xué)習(xí)能力(即無錯誤識別未來樣本的能力)之間尋求最佳平衡的機器學(xué)習(xí)方法。
[0109]如本文所用,術(shù)語“特征”是指一種或多種變量或變量的組合。在本申請中包括九肽重復(fù)序列、單核苷酸多態(tài)性和中性微衛(wèi)星。
[0110]如本文所用,術(shù)語“特征評估”是指對特征進行評級后基于其對目標(biāo)特征的影響選擇特征。
[0111]如本文所用,術(shù)語“十折交叉驗證”是指在交叉驗證中折數(shù)被固定為10,數(shù)據(jù)將被大致分為十個分區(qū),每個分區(qū)被輪流用于測試而剩余分區(qū)被用于訓(xùn)練,重復(fù)此過程十次,即十折交叉驗證,是準(zhǔn)確估計誤差的標(biāo)準(zhǔn)程序。
[0112]如本文所用,術(shù)語“綜合成功率”是指正確的分類數(shù)(正確的肯定和正確的否定)除以總體分類數(shù)(正確的肯定、正確的否定、錯誤的肯定、錯誤的否定)。
[0113]如本文所用 ,術(shù)語“誤差率”就是I減去綜合成功率。
[0114]本發(fā)明提供了三類地理特異性間日瘧原蟲分子標(biāo)記的應(yīng)用,即間日瘧原蟲環(huán)子孢子蛋白(PvCSP)中央重復(fù)區(qū)序列、二氫葉酸還原酶(DHFR)序列中3個單核苷酸多態(tài)性(第171、174、182位SNP)、二氫蝶呤合成酶(DHPS)序列中2個單核苷酸多態(tài)性(第1461、1971位SNP)、3個中性微衛(wèi)星(3.35、9-AT、12.335)序列,在蟲株溯源中的應(yīng)用。
[0115]本發(fā)明還提供了一種通過包含由至少一種分子標(biāo)記創(chuàng)建的至少一種特征的間日瘧原蟲數(shù)據(jù)集,以及至少一種分類模型,并利用這些分類模型創(chuàng)建的多種特征對未來新蟲株進行地區(qū)分類的方法,其步驟包括:
[0116](a)構(gòu)建數(shù)據(jù)集;
[0117](b)創(chuàng)建一個基于支持向量機的分類模型;
[0118](C)基于步驟(b)中的發(fā)現(xiàn)選擇對分類貢獻較大的特征(特征評估);
[0119](d)創(chuàng)建具備以上特征的分類模型,并進行十折交叉驗證;
[0120](e)逐步增加新特征,直至獲得具備理想的綜合成功率、誤差率、真正元比率、假正元比率和精確率的分類模型。
[0121]本發(fā)明還提供了三種溯源應(yīng)用的分類模型:
[0122](a)即采用PvCSP中央重復(fù)區(qū)中第7、8、14三個九肽重復(fù)序列區(qū)分云南/海南與華中地區(qū)蟲株,其綜合成功率為94.39%、誤差率為5.62%、真正元比率分別為0.978和0.91、假正元比率分別為0.09和0.022,精確率分別為0.914和0.977 ;更佳地,采用PvCSP中央重復(fù)區(qū)中第7、8、10、14四個九肽重復(fù)序列創(chuàng)建分類模型時,綜合成功率為94.65%、誤差率為
5.35%、真正元比率分別為0.973和0.921、假正元比率分別為0.079和0.027,精確率分別為 0.923 和 0.972 ;
[0123](b)或采用中性微衛(wèi)星3.35、9-AT、12.335區(qū)分云南/海南與華中地區(qū)蟲株,其綜合成功率為90.36%、誤差率為9.64%、真正元比率分別為0.917和0.892、假正元比率分別為0.108和0.083,精確率分別為0.883和0.924 ;
[0124](c)或采用DHFR中第171、174位SNP與DHPS中第1461位SNP區(qū)分云南、海南與華中地區(qū)蟲株,其綜合成功率為99.17%、誤差率為0.83%、真正元比率分別為1、I和0.892、假正元比率分別為0.009、0.007和O,精確率分別為0.992、0.99和I。
[0125]優(yōu)選地,采用DHFR中第171、174、182位SNP與DHPS中第1461、1971位SNP區(qū)分云南、海南與華中地區(qū)蟲株,其綜合成功率為99.38%,誤差率為0.62%、真正元比率分別為1、I和0.919、假正元比率分別為0.009、0.003和O,精確率分別為0.992、0.995和I。
[0126]本發(fā)明提供一種溯源的分步策略,即以兩步法對蟲株進行地區(qū)分類。它包括第一步采用采用PvCSP中央重復(fù)區(qū)中第7、8、10、14四個九肽重復(fù)序列或中性微衛(wèi)星3.35、9_AT、
12.335區(qū)分云南/海南與華中地區(qū)蟲株,第二步采用DHFR中第171、174、182位SNP與DHPS中第1461、1971位SNP區(qū)分云南、海南與華中地區(qū)蟲株。
[0127]本發(fā)明還提供了一種對間日瘧原蟲蟲株樣本進行地理溯源或地理特異性分類的試劑盒,所述的試劑盒包括選自下組的試劑:
[0128](I)用于檢測環(huán)子孢子蛋白中央重復(fù)區(qū)中第7、第8、第10、或第14個九肽重復(fù)序列的試劑;
[0129](2)用于檢測二氫葉酸還原酶核苷酸序列中第171、第174、或第182位SNP位點的試劑;
[0130](3)用于檢測二氫蝶呤合成酶核苷酸序列中第1461、或第1971位SNP位點;
[0131](4)用于檢測3.35中性微衛(wèi)星、9-AT中性微衛(wèi)星、或12.335中性微衛(wèi)星的試劑;
[0132](5)上述試劑的任意組合;和
[0133](6)使用說明書,所述說明書描述了本發(fā)明的方法。
[0134]本發(fā)明的主要優(yōu)點如下:`
[0135](I)本發(fā)明提供了綜合了反映種群隔離、遺傳漂變、遷移、自然選擇的多種分子標(biāo)記,確保了溯源的科學(xué)性;
[0136](2)本發(fā)明僅通過數(shù)個分子(可以少達3個)標(biāo)記達到溯源目的。
[0137]下面結(jié)合具體實施例,進一步闡述本發(fā)明。應(yīng)理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件如 Sambrook 等人,分子克隆:實驗室手冊(New York:Cold Spring Harbor LaboratoryPress, 1989)中所述的條件,或按照制造廠商所建議的條件。
[0138]實施例1
[0139]間日瘧原蟲環(huán)子孢子蛋白中央重復(fù)區(qū)核心九肽重復(fù)序列的分類,以及創(chuàng)建特征模型
[0140]1.間日瘧原蟲環(huán)子孢子蛋白中央重復(fù)區(qū)中核心九肽重復(fù)序列的檢測
[0141](a)引物的設(shè)計
[0142]序列來自間日瘧原蟲Belem株參考序列(全序列見SEQ ID NO:1, GenBankaccession n0.M 11926)。
[0143]擴增中央重復(fù)區(qū)的外引物為:
[0144]CSP-WF:5’GCATAAGGCAAACTCACAAA 3’ (SEQ ID NO:4),
[0145]CSP-WR:5' CGCATAATGTGTAAGAGGTGT 3’ (SEQ ID NO:5)。
[0146]內(nèi)引物為:T-CS-F:5’AAGCAAGCAAAACAGCCAAA 3’ (SEQ ID NO:6),
[0147]T-CS-R:5’GCAAACAGCAGGGAACATT 3’ (SEQ ID NO:7)。
[0148](b)PCR擴增條件為:98°C 20秒(變性)、57°C 30秒(退火)和68°C 60秒(延伸),每次25個循環(huán)。PCR產(chǎn)物用0.8%瓊脂糖膠分離。電泳緩沖液為1XTAE,電壓15V/cm,電泳20min,紫外燈下觀察擴增產(chǎn)物。產(chǎn)物全長1297bp,經(jīng)膠純化后測序。
[0149](C)PvCSP中央重復(fù)區(qū)分析
[0150]具體地,分析中央重復(fù)區(qū)中所有九肽重復(fù)序列。類型可能包括:⑶RAAGQPA、⑶RADGQPA、GNGAGGQAA、GNGAGGQPA、⑶GADGQPA、GDRADGQAA、⑶GADGQAA、GDGAAGQPA、GNGADGQAA、GNGAAGQAA、GNGADGQAA、ANGAGNQPG、ANGAGNQPG。
[0151]2.創(chuàng)建特征為環(huán)子孢子蛋白中央重復(fù)區(qū)中核心九肽重復(fù)序列的分類模型包括步驟:
[0152](a)創(chuàng)建一個包含中央重復(fù)區(qū)中所有九肽重復(fù)序列的數(shù)據(jù)集csv文件;
[0153](b)打開WEKA,進入分類器功能界面,設(shè)置Iibsvm路徑并激活,打開csv數(shù)據(jù)文件;
[0154](c)選擇支持向量機分類算法,對云南/海南與華中地區(qū)蟲株進行預(yù)分類;結(jié)果顯示:綜合成功率為94.12%,誤差率為5.88%、真正元比率分別為0.973和0.91、假正元比率分別為0.09和0.027,精確率分別為0.914和0.972 ;
[0155](d)進行特征評估;貢獻分值較高的前五個特征分別為
[0156]R8(336.6±0.49)、
[0157]R7(189.311±7.239)、
[0158]R10(156.134±5.241)、
[0159]R14(127.555±6.469)、
[0160]R12(lll.497±5.815);
[0161](e)逐步保留貢獻分值較高的特征,建立新的分類模型,并采用十折交叉驗證來選擇和評估模型。直至獲得具備理想的評估結(jié)果及可信度的分子標(biāo)記組合。在分子標(biāo)記數(shù)盡可能少,綜合成功率和精確率盡可能高的原則下,確立分類模型。
[0162]如采用PvCSP中央重復(fù)區(qū)中第7、8、10、14四個九肽重復(fù)序列創(chuàng)建分類模型時,綜合成功率為94.65%、誤差率為5.35%、真正元比率分別為0.973和0.921、假正元比率分別為0.079和0.027,精確率分別為0.923和0.972。
[0163]3.核心九肽重復(fù)序列類型分析
[0164]表1顯示了本實施例中,來自我國云南、海南及華中地區(qū)間日瘧原蟲的多個樣本在PvCSP第7、8、10、14四個九肽重復(fù)區(qū)的重復(fù)單位類型。
[0165]表1
[0166]
【權(quán)利要求】
1.一種間日瘧原蟲分子標(biāo)記的用途,其特征在于,所述的間日瘧原蟲分子標(biāo)記選自下組: (1)環(huán)子孢子蛋白中央重復(fù)區(qū)中第7、第8、第10、或第14個九肽重復(fù)序列; (2)二氫葉酸還原酶核苷酸序列中第171、第174、或第182位SNP位點; (3)二氫蝶呤合成酶核苷酸序列中第1461、或第1971位SNP位點; (4)3.35中性微衛(wèi)星、9-AT中性微衛(wèi)星、或12.335中性微衛(wèi)星; (5)上述任意組合; 它們被: (a)用作間日瘧原蟲蟲株的地理溯源的分子標(biāo)記,或用作間日瘧原蟲地理特異性分類的分子標(biāo)記;或 (b)用于制備進行間日瘧原蟲蟲株的地理溯源分析的試劑盒或試劑,或用于制備對間日瘧原蟲進行地理特異性分類的試劑盒或試劑。
2.如權(quán)利要求1所述的用途,其特征在于,還包括選自下組的一個或多個特征: (i)所述的環(huán)子孢子蛋白的編碼基因全序列如SEQID ΝΟ:1所示; (ii)所述的二氫葉酸還原酶核苷酸序列如SEQID NO:2所示; (iii)所述的二氫蝶呤合`成酶核苷酸序列如SEQID NO:3所示。
3.如權(quán)利要求1所述的用途,其特征在于,還包括選自下組的一個或多個特征: (i)所述的間日瘧原蟲分子標(biāo)記為:環(huán)子孢子蛋白中央重復(fù)區(qū)中第7、第8、第10以及第14個九肽重復(fù)序列的組合; (?)所述的間日瘧原蟲分子標(biāo)記為:二氫葉酸還原酶核苷酸序列中第171、第174、第182位SNP位點,以及二氫蝶呤合成酶核苷酸序列中第1461、第1971位SNP位點的組合;(iii)所述的間日瘧原蟲分子標(biāo)記為:3.35中性微衛(wèi)星、9-AT中性微衛(wèi)星、以及12.335中性微衛(wèi)星的組合。
4.如權(quán)利要求1所述的用途,其特征在于,所述的間日瘧原蟲分子標(biāo)記為: 環(huán)子孢子蛋白中央重復(fù)區(qū)中第7、第8、第10以及第14個九肽重復(fù)序列;二氫葉酸還原酶核苷酸序列中第171、第174、第182位SNP位點,以及二氫蝶呤合成酶核苷酸序列中第1461、第1971位SNP位點;3.35中性微衛(wèi)星、9-AT中性微衛(wèi)星、以及12.335中性微衛(wèi)星的所有組合。
5.一種對待檢測的間日瘧原蟲蟲株樣本進行地理溯源或地理特異性分類的方法,其特征在于,包括步驟: (Al)對待檢測的間日瘧原蟲樣本,檢測下述分子標(biāo)記: (1)環(huán)子孢子蛋白中央重復(fù)區(qū)中第7、第8、第10、或第14個九肽重復(fù)序列; (2)二氫葉酸還原酶核苷酸序列中第171、第174、或第182位SNP位點; (3)二氫蝶呤合成酶核苷酸序列中第1461、或第1971位SNP位點; (4)3.35中性微衛(wèi)星、9-AT中性微衛(wèi)星、或12.335中性微衛(wèi)星; (5)上述任意組合; (BI)對所述分子標(biāo)記檢測結(jié)果進行分析判定,基于以下一個或多個標(biāo)準(zhǔn)進行地理溯源或地理特異性分類: 在待檢測的間日瘧原蟲樣本中,如果:環(huán)子孢子蛋白中央重復(fù)區(qū)中第7個九肽重復(fù)序列為⑶RADGQAA,則判定所述的間日瘧原蟲來源于華中; 或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第8個九肽重復(fù)序列為GNGAGGQPA,則判定所述的間日瘧原蟲來源于華中; 或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第10個九肽重復(fù)序列為⑶GAAGQPA,則判定所述的間日瘧原蟲來源于華中; 或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第14個九肽重復(fù)序列為GNGAGGQPA,則判定所述的間日瘧原蟲來源于華中; 或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第7個九肽重復(fù)序列為GDRAAGQPA,,則判定所述的間日瘧原蟲來源于海南; 或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第8個九肽重復(fù)序列為GDRAAGQPA,則判定所述的間日瘧原蟲來源于海南; 或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第10個九肽重復(fù)序列為GDRAAGQPA,則判定所述的間日瘧原蟲來源于海南; 或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第14個九肽重復(fù)序列為GDRAAGQPA,則判定所述的間日瘧原蟲來源于海南; 或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第14個九肽重復(fù)序列為GNGAGGQPA,則判定所述的間日瘧原蟲來源于海南; 或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第7個九肽重復(fù)序列為GDRAAGQPA,則判定所述的間日痕原蟲來源于云南;` 或,如果環(huán)子孢子蛋中央重復(fù)區(qū)中第8個九肽重復(fù)序列為GDRAAGQPA,并則判定所述的間日痕原蟲來源于云南; 或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第10個九肽重復(fù)序列為GDRAAGQPA,則判定所述的間日痕原蟲來源于云南; 或,如果環(huán)子孢子蛋白中央重復(fù)區(qū)中第14個九肽重復(fù)序列為⑶RADGQPA,則判定所述的間日痕原蟲來源于云南; 或,如果二氫葉酸還原酶核苷酸序列中第171、第174、或第182位SNP位點、或二氫蝶呤合成酶核苷酸序列中第1461、或第1971位SNP位點發(fā)生突變,則判定所述的間日瘧原蟲來源于云南; 或,如果二氫葉酸還原酶核苷酸序列中第174位SNP位點發(fā)生突變,則所述的間日瘧原蟲來源于海南; 或,如果二氫蝶呤合成酶核苷酸序列中第1971位SNP位點發(fā)生突變,則判定所述的間日瘧原蟲來源于海南; 或,如果3.35中性微衛(wèi)星中AT重復(fù)單元為9次,則判定所述的間日瘧原蟲來源于華中; 或,如果3.35中性微衛(wèi)星中AT重復(fù)單元為9或10次,則判定所述的間日瘧原蟲來源于海南; 或,如果3.35中性微衛(wèi)星中AT重復(fù)單元為9、11或13次,則判定所述的間日瘧原蟲來源于云南;或,如果9-AT中性微衛(wèi)星中AT重復(fù)單元為5次,則判定所述的間日瘧原蟲來源于華中; 或,如果9-AT中性微衛(wèi)星中AT重復(fù)單元為5、17或19次,則判定所述的間日瘧原蟲來源于海南; 或,如果9-AT中性微衛(wèi)星中AT重復(fù)單元為28或30次,則判定所述的間日瘧原蟲來源于云南; 或,如果12.335中性微衛(wèi)星中AT重復(fù)單元為10次,則判定所述的間日瘧原蟲來源于華中; 或,如果12.335中性微衛(wèi)星中AT重復(fù)單元為10或11次,則判定所述的間日瘧原蟲來源于海南; 或,如果12.335中性微衛(wèi)星中AT重復(fù)單元為11次,則判定所述的間日瘧原蟲來源于云南。
6.如權(quán)利要求5所述的方法,其特征在于,還包括步驟(Cl): (Cl)對判定結(jié)果進行匯總,其中, 當(dāng)采用多個標(biāo)準(zhǔn)得出的判定結(jié)果一致時,則匯總為該一致結(jié)果; 當(dāng)采用多個標(biāo)準(zhǔn)得出的判定結(jié)果不一致但存在優(yōu)勢判定結(jié)果時,則匯總為該優(yōu)勢判定結(jié)果;` 當(dāng)采用多個標(biāo)準(zhǔn)得出的判定結(jié)果不一致且不存在優(yōu)勢判定結(jié)果時,則再測量步驟(A)中所述的其他分子標(biāo)記并進行判定;或基于步驟(B)中其他標(biāo)準(zhǔn)進行判定,并再次進行匯總分析。
7.一種對待檢測的間日瘧原蟲蟲株樣本進行地理溯源或地理特異性分類的方法,其特征在于,包括步驟: (A2)對待檢測的間日瘧原蟲樣本,檢測下述分子標(biāo)記: (1)環(huán)子孢子蛋白中央重復(fù)區(qū)中第7、第8、第10、或第14個九肽重復(fù)序列; (2)二氫葉酸還原酶核苷酸序列中第171、第174、或第182位SNP位點; (3)二氫蝶呤合成酶核苷酸序列中第1461、或第1971位SNP位點; (4)3.35中性微衛(wèi)星、9-AT中性微衛(wèi)星、或12.335中性微衛(wèi)星; (5)上述任意組合; (B2)對所述分子標(biāo)記檢測結(jié)果進行分析判定: 當(dāng)對一待檢測樣本檢測了 η個分子標(biāo)記時,分別確定η個分子標(biāo)記檢測結(jié)果在華中、云南和海南的虛擬積分Cn、Yn、Hn,其中η為大于I的正整數(shù)(如1_30),并計算三種虛擬積分之和,SCi, ΣΥ?, ΣΗ?,其中 i = I — η ; 其中所述虛擬積分Cn、Yn、Hn為所述分子標(biāo)記η在華中、云南和海南間日瘧原蟲中出現(xiàn)頻率; (C2)比較Cn、Yn和Hn,從而得出最大值,并將對待檢測的間日瘧原蟲蟲株樣本的地理溯源或地理特異性分類為最大值所對應(yīng)的地理區(qū)域。
8.如權(quán)利要求7所述的方法,其特征在于,在步驟(B2)中,分子標(biāo)記在華中、云南和海南間日瘧原蟲中的出現(xiàn)頻率如表2 —表9所示。
9.如權(quán)利要求5或7所述的方法,其特征在于,所述的二氫葉酸還原酶核苷酸序列中第171、第174、或第182位SNP位點,或二氫蝶呤合成酶核苷酸序列中第1461、或第1971位SNP位點是指: 二氫葉酸還原酶核苷酸序列中第171位SNP由C突變?yōu)锳或G、第174位SNP由C突變?yōu)镚、第182位SNP由C突變?yōu)門 ;以及二氫蝶呤合成酶核苷酸序列中第1461位SNP由C突變?yōu)镚、第1971位SNP由C突變?yōu)镚。
10.一種對間日瘧原蟲蟲株樣本進行地理溯源或地理特異性分類的試劑盒,其特征在于,所述的試劑盒包括選自下組的試劑: (1)用于檢測環(huán)子孢子蛋白中央重復(fù)區(qū)中第7、第8、第10、或第14個九肽重復(fù)序列的試劑; (2)用于檢測二氫葉酸還原酶核苷酸序列中第171、第174、或第182位SNP位點的試劑; (3)用于檢測二氫蝶呤合成酶核苷酸序列中第1461、或第1971位SNP位點; (4)用于檢測3.35中性微衛(wèi)星、9-AT中性微衛(wèi)星、或12.335中性微衛(wèi)星的試劑; (5)上述試劑的任意組合;和 使用說明書。`
【文檔編號】C12N15/11GK103865979SQ201210529628
【公開日】2014年6月18日 申請日期:2012年12月10日 優(yōu)先權(quán)日:2012年12月10日
【發(fā)明者】潘衛(wèi)慶, 丁帥, 張冬梅 申請人:中國人民解放軍第二軍醫(yī)大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1