本發(fā)明涉及一種個體識別的方法和系統(tǒng),尤其涉及一種對未知檢材進行個體識別的方法和系統(tǒng)。
背景技術:
插入-缺失多態(tài)性(insertion-deletion,InDel),是一段DNA片段的插入或者缺失所形成的特殊類型的二等位基因多態(tài)性。相對于STR與SNP,InDel有以下幾個特點:(1)廣泛的分布在整個基因組中;(2)緣于單突變事件,并且發(fā)生頻率低,發(fā)生后較穩(wěn)定,不易復發(fā)突變;(3)可以成為始祖信息位點,判斷地域來源;(4)InDel可以在較小的擴增子中擴增,適用于降解DNA的檢測;(5)InDel可以利用法醫(yī)DNA實驗室現(xiàn)有的儀器設備進行基因分型;(6)InDel同時可以適用于自動化和高通量的技術。
因此,InDel受到國內(nèi)外學者的關注,并且已有多位學者建立了適用于對本民族多態(tài)性研究的復合體系。但由于中國人群中各民族等位基因多樣,如何建立了一套基于InDel基因座的、適用于廣泛的中國人群的法醫(yī)DNA鑒定的復合擴增體系,使之成為替代STR檢測體系分析DNA樣本的另一有力手段,成為有待解決的問題。
技術實現(xiàn)要素:
本發(fā)明提供了一種對未知檢材進行個體識別的方法,能獲得未知檢材包括30個InDel基因座與1個性別鑒定基因座在內(nèi)共31個基因座的分型結果,從而實現(xiàn)對未知檢材的個體識別。
本發(fā)明還提供一種對未知檢材進行個體識別的系統(tǒng),通過該系統(tǒng)可以實現(xiàn)對未知檢材針對上述31個基因座的準確分型,從而對未知檢材進行個體識別。
本發(fā)明還提供了一種復合檢測體系,所述檢測體系能準確獲得未知檢材包括30個InDel基因座與1個性別鑒定基因座在內(nèi)共31個基因座的分型結果。
本發(fā)明還提供了一種檢測試劑盒,包括所述的復合檢測體系。
本發(fā)明提供的一種對未知檢材進行個體識別的方法,該方法包括:
1)提取未知檢材的DNA;
2)獲得所述DNA包括30個InDel基因座與1個性別鑒定基因座Amelogenin在內(nèi)共31個基因座的分型結果,所述30個InDel基因座為rs10629077、rs2308026、rs361519、rs2307652、rs16671、rs33948716、rs8190507、rs1610937、rs2307689、rs2307976、rs1305056、rs2067353、rs1610963、rs2307632、rs17878444、rs140847、rs2307554、rs2308020、rs1610902、rs2307839、rs2307708、rs2308115、rs3047269、rs2067294、rs2307553、rs16438、rs2307981、rs4646006、rs2308072和rs140864;
3)根據(jù)未知檢材31個基因座的基因型進行個體識別。
在本發(fā)明的方案中,所述31個基因座是申請人通過對中國人群的生活環(huán)境、種族起源等進行綜合分析,考察各地區(qū)民族人口的表型特征差異,包括外形特征,生理指標等,針對這些差異進行文獻和網(wǎng)絡數(shù)據(jù)庫調(diào)研,在已有研究的基礎上獲得的能進行個體識別和親權鑒定的特異性基因座的組合。所述未知檢材可以為來自人體的血樣、脫落細胞、骨頭、牙齒、精斑和口腔拭子等樣本,這些樣本的個體來源未知。
在本發(fā)明的一個具體實施方式中,所述2)包括采用與所述31個基因座一一對應的31對擴增引物對其進行擴增以獲得擴增產(chǎn)物的步驟;所述擴增引物為序列表中SEQ ID No.1至SEQ ID No.62的核苷酸序列。
在本發(fā)明的另一個具體實施方式中,其中2)還包括在獲得擴增產(chǎn)物后,使用遺傳分析儀分析該擴增產(chǎn)物,以獲得所述31個基因座的基因型的步驟。在本發(fā)明的方案中,所述遺傳分析儀可以是本領域技術人員常規(guī)使用的遺傳分析儀,例如ABI3130或ABI3500型遺傳分析儀,通過ID-X軟件或其他GeneMapper軟件等分析該PCR擴增產(chǎn)物中所述31個基因座的基因型。
本發(fā)明提供的一種對未知檢材進行個體識別的系統(tǒng),所述系統(tǒng)包括DNA提取體系,復合檢測體系,以及推斷體系;所述DNA提取體系用于提取未知檢材的DNA;所述復合檢測體系用于獲得所述DNA包括30個InDel基因座與1個性別鑒定基因座Amelogenin在內(nèi)共31個基因座的分型結果,所述30個InDel基因座為rs10629077、rs2308026、rs361519、rs2307652、rs16671、rs33948716、rs8190507、rs1610937、rs2307689、rs2307976、rs1305056、rs2067353、rs1610963、rs2307632、rs17878444、rs140847、rs2307554、rs2308020、rs1610902、rs2307839、rs2307708、rs2308115、rs3047269、rs2067294、rs2307553、rs16438、rs2307981、rs4646006、rs2308072和rs140864;
所述推斷體系用于根據(jù)未知檢材31個基因座的基因型進行個體識別。
在本發(fā)明的一個具體實施方式中,所述復合檢測體系用于采用與所述31個基因座一一對應的31對擴增引物對其進行擴增以獲得擴增產(chǎn)物,所述擴增引物為序列表中SEQ ID No.1至SEQ ID No.62的核苷酸序列。
更進一步的,所述復合檢測體系還用于在獲得擴增產(chǎn)物后,使用遺傳分析儀分析該擴增產(chǎn)物,以獲得所述31個基因座的基因型。
本發(fā)明提供的一種復合檢測體系,所述體系包括未知檢材DNA,31個基因座,以及擴增引物,所述復合檢測體系用于獲得所述DNA包括30個InDel基因座與1個性別鑒定基因座Amelogenin在內(nèi)共31個基因座的分型結果,所述30個InDel基因座為rs10629077、rs2308026、rs361519、rs2307652、rs16671、rs33948716、rs8190507、rs1610937、rs2307689、rs2307976、rs1305056、rs2067353、rs1610963、rs2307632、rs17878444、rs140847、rs2307554、rs2308020、rs1610902、rs2307839、rs2307708、rs2308115、rs3047269、rs2067294、rs2307553、rs16438、rs2307981、rs4646006、rs2308072和rs140864;所述擴增引物由與所述31個基因座一一對應的31對擴增引物組成,所述擴增引物為序列表中SEQ ID No.1至SEQ ID No.62的核苷酸序列。
在本發(fā)明的方案中,所述DNA聚合酶可以是Fast Start DNA聚合酶、Taq DNA聚合酶、Hotstart DNA聚合酶中的一種或多種。
本發(fā)明還提供了一種檢測試劑盒,包括所述的復合檢測體系。
在本發(fā)明的方案中,本發(fā)明利用所述復合檢測體系進行31個基因座的分型的方法,包括:1)將提取的未知檢材DNA作為模板;2)使用所述擴增引物對作為模板的未知檢材DNA進行多重PCR擴增反應以得到擴增產(chǎn)物;3)將所述擴增產(chǎn)物利用遺傳分析儀進行分析,以獲得31個基因座的分型結果。
本發(fā)明方案具有以下的優(yōu)點:
1、本發(fā)明的方法和系統(tǒng)采用特定的31個基因座進行個體識別,這些基因座在漢族、哈薩克族、傣族、苗族與瑤族五個民族的遺傳多態(tài)性調(diào)查中,累積個人識別率分別為0.999999999957、0.999999999990、0.999999999974、0.999999999875及0.999999999966,具有較高的累積個體識別率。
2、本發(fā)明的方法和系統(tǒng)適用于廣泛的中國人群,可以為法庭科學實驗室檢測降解檢材提供有效的技術支持,同時降低檢測成本,成為替代STR檢測體系進行DNA樣本分析的另一有力手段。
3、本發(fā)明提供的方案能有效從基因水平實現(xiàn)對未知檢材來源的推斷,為中國人群個體識別及親權關系鑒定等提供準確的科學依據(jù)。
附圖說明
圖1利用復合擴增體系檢驗標準DNA9947樣品的分型圖譜。
具體實施方式
以下實施例中使用的421份無關個體的新鮮外周靜脈血樣,其中北京漢族94份,云南傣族97份,新疆哈薩克族95份,廣西苗族69份,廣西瑤族66份,由公安部物證鑒定中心提供。
以下實施例中使用的dNTP(10mM)、10×PCR buffer(15mM Mg2+)、10×PCR buffer(15mM Mg2+)、快速啟動酶Hotstar Taq plus(5U/μl)、人類標準品(9947,1ng/μl)、分子量內(nèi)標Typer500均購自公安部物證鑒定中心,POP7電泳凝膠、去離子甲酰胺均購自美國AB公司,熒光標記PCR引物由上海生工合成。9700型PCR儀,3130XL遺傳分析儀為美國AB公司。
實施例1、對本發(fā)明的對未知檢材進行個體識別的方法和系統(tǒng)準確性的驗證
在本實施例中,所述未知檢材為421份無關個體的新鮮外周靜脈血樣,其中北京漢族94份,云南傣族97份,新疆哈薩克族95份,廣西苗族69份,廣西瑤族66份,已知其個體來源,但在本申請實施例1的實施過程中設定其個體來源未知,采用本申請方法和系統(tǒng)對其進行個體識別,包括:
1)利用本發(fā)明的系統(tǒng)中的DNA提取體系提取未知檢材的DNA,2)利用本發(fā)明的系統(tǒng)中的復合檢測體系獲得所述DNA包括30個InDel基因座與1個性別鑒定基因座Amelogenin在內(nèi)共31個基因座的分型結果,3)利用本發(fā)明的系統(tǒng)中所述推斷體系,根據(jù)未知檢材31個基因座的基因型進行個體識別。
本實施例中,所述復合檢測體系包括未知檢材DNA,31個基因座,以及擴增引物,所述復合檢測體系用于獲得所述DNA包括30個InDel基因座與1個性別鑒定基因座在內(nèi)共31個基因座的分型結果,所述30個InDel基因座為rs10629077、rs2308026、rs361519、rs2307652、rs16671、rs33948716、rs8190507、rs1610937、rs2307689、rs2307976、rs1305056、rs2067353、rs1610963、rs2307632、rs17878444、rs140847、rs2307554、rs2308020、rs1610902、rs2307839、rs2307708、rs2308115、rs3047269、rs2067294、rs2307553、rs16438、rs2307981、rs4646006、rs2308072和rs140864;所述擴增引物由與所述31個基因座一一對應的31對擴增引物組成,所述擴增引物為序列表中SEQ ID No.1至SEQ ID No.62的核苷酸序列。
1、提取待檢測樣本的DNA作為模板
按照DNA Blood Midi Kit說明書(Qiagen,德國)提取血樣DNA。所有DNA均經(jīng)Nanodrop2000c(Thermo Scientific,美國)定量后,用超純水稀釋為0.5ng/μl-1ng/μl使用。
2、利用所述復合檢測體系進行31個基因座的分型,包括:將提取的未知檢材DNA作為模板;使用所述擴增引物對提取的DNA模板進行多重PCR擴增反應,以獲得擴增產(chǎn)物;將擴增產(chǎn)物利用遺傳分析儀確定31個基因座的分型結果。
具體過程如下:
2.1、引物池配置
擴增引物池的配置,其中所述擴增引物中為所述31個基因座一一對應的31對擴增引物,本實施例中,優(yōu)選的,所述31個基因座的擴增引物為序列表中SEQ ID No.1至SEQ ID No.62的核苷酸序列;本發(fā)明提供的各種引物序列由上海生工生物工程技術服務有限公司合成。
將合成好的引物用1×TE緩沖液稀釋到100μM,將31個基因座的上下游引物按照以下體積和濃度進行混合作為31重PCR引物池(即PrimerMix)。
2.2、多重PCR反應
本實施例使用9700型PCR擴增儀進行多重PCR反應。
(1)配置PCR mix(10μL體系),如下表5所示。
表5
(2)擴增程序
PCR擴增過程的熱循環(huán)參數(shù)為:95℃11min;94℃30s,60℃120s,72℃90s,共30個循環(huán);60℃延伸60min。
2.3、PCR產(chǎn)物分型
取1μL PCR產(chǎn)物與9.5μL去離子甲酰胺、Typer500內(nèi)標混勻,95℃3min后立即冰浴5min。對擴增產(chǎn)物采用ABI 3130XL型遺傳分析儀通過ID v3.2軟件進行分析,獲得所述31個基因座的基因型。
2.4、結果分析
為了驗證分型結果的準確性,從421份DNA樣品中隨機抽取50份DNA樣品,對31個基因座進行測序(北京邁奧德恩生物科技有限公司測序),采用本實施例的復合檢測體系獲得的所有的分型結果與測序結果均一致,一致性達到100%,此結果證本發(fā)明復合檢測體系分型結果準確。
同時使用標準DNA9947為模板使用本發(fā)明的系統(tǒng)進行PCR擴增,并對其31個基因座進行分型,分型結果見圖1所示,與DNA9947測序結果一致。
3、根據(jù)未知檢材31個基因座的基因型進行個體識別
由本實施例方法獲得的上述421份檢材的個體來源結果,與其已知的個體來源結果一致,說明本發(fā)明方法可以對未知檢材進行個體識別。
實施例2本發(fā)明檢測系統(tǒng)中30個InDel基因座在不同民族的平衡檢驗
采用本發(fā)明系統(tǒng)按照實施例1所述方法獲得421例人的無關個體的分型結果,并基于30個基因座在各民族中的個體識別率(DP值,見表6),計算30個常染色體InDel基因座在漢族、哈薩克族、傣族、苗族與瑤族五個民族的累積個體識別率(TDP)。
表6
累積個體識別率計算公式為:
TDP=1-(1-DP1)(1-DP2)(1-DP3)…(1-DPK),其中DPK為第k個基因座的DP值。
本申請的檢測系統(tǒng)大大提高了對個體的累積個體識別率,在漢族、哈薩克族、傣族、苗族與瑤族五個民族的遺傳多態(tài)性調(diào)查中,累積個人識別率分別為0.999999999957、0.999999999990、0.999999999974、0.999999999875及0.999999999966,具有較高的遺傳多態(tài)性和累積個體識別率。
序列表
<110> 公安部物證鑒定中心
<120> 一種對未知檢材進行個體識別的方法和系統(tǒng)
<130> 165944GF
<160> 62
<170> PatentIn version 3.5
<210> 1
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 1
aatctactct cttgtgccca ctt 23
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 2
aaggcaggaa tgatgagcaa 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 3
aagctgcagg aatcaccaag 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 4
cacggtctag gctcctttca 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 5
tcatgttgca cacaaatact 20
<210> 6
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 6
actttgcttt cttggttgt 19
<210> 7
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 7
gccatgctcc tggttcact 19
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 8
aatacagcaa ccctgctcca 20
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 9
ctttcagagg ctaaacagac 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 10
agatcatgga ctcatcaagt 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 11
ggaaaagggg aatcaggaaa 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 12
tcgcaccatt ccagtaacaa 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 13
actggctact ttggcgtctg 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 14
agcccgcctt aaacagagag 20
<210> 15
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 15
ccaaatagga tgtacagcag gtc 23
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 16
ctgcagaaaa tgggtcatgt 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 17
ccaaacctcc tccctcagaa 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 18
agcagccgga tattgggtat 20
<210> 19
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 19
ggaaacggca cttatgactt c 21
<210> 20
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 20
ccgcagatat tagcctgacc 20
<210> 21
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 21
tggcagagac tgaaggatga a 21
<210> 22
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 22
ctgcctcaga acaaaactga a 21
<210> 23
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 23
attaaggttt ccggcctcac 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 24
gggaagatga gaaagcaggt 20
<210> 25
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 25
cctccaagta agcattagc 19
<210> 26
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 26
gctcactgaa ctgacataa 19
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 27
taggcagaag gaattgagtg 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 28
cctaatttgg ccatctgact 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 29
gccaaggaac aaactcctca 20
<210> 30
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 30
ttacctgact tacttgccca aa 22
<210> 31
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 31
gaaaaaaatt gaatcgtgat atc 23
<210> 32
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 32
ttgatattac caggatagca ttca 24
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 33
aggttttgag aggtggagga 20
<210> 34
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 34
cgccaggaat tttctatcca t 21
<210> 35
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 35
gagcacatca caaattcagt cag 23
<210> 36
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 36
tgtgctgtaa atgtagccat gt 22
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 37
agagccagtt agagggagga 20
<210> 38
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 38
catcccagag gacttgagg 19
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 39
ggcatcattc gtggtgatta 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 40
agtgcttctc cagctcctca 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 41
atgccctttg actaaatatg 20
<210> 42
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 42
ggctcatatt atacagcagt t 21
<210> 43
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 43
cactactgag atgctttcac caa 23
<210> 44
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 44
cctttcctgt acgtgcttct tt 22
<210> 45
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 45
gagacaggca caccagcat 19
<210> 46
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 46
tgccaaacct tccttgtatc t 21
<210> 47
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 47
ctatgctatc ccggcaattc 20
<210> 48
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 48
cgaggagtga acaagaagca 20
<210> 49
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 49
atacctgcaa agtgggcatt 20
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 50
ccagcaaaca gaacacaagg 20
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 51
gtatggcctc ctccacagag 20
<210> 52
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 52
acagcccacc agagcactac 20
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 53
accgggtgtg cattctacat 20
<210> 54
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 54
gtgcctggcc aagaaaatta 20
<210> 55
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 55
cagatcagca aaggctggta 20
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 56
gtttggaaag aaaggcagga 20
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 57
gcacccagcc ttctccttat 20
<210> 58
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 58
gtggttcatt tcagactaca actca 25
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 59
accacaggca aatcctgaag 20
<210> 60
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 60
gggttaggga ggttggttga 20
<210> 61
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 61
ccctgggctc tgtaaagaa 19
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 62
gagcttaaac tgggaagctg 20