本發(fā)明屬于分子標記領域,具體涉及蓮霧est-ssr分子標記。
背景技術:
蓮霧[syzygiumsamarangense(blume)merri.etperry]原產(chǎn)于馬來半島及安達曼群島,是桃金娘科(myrtaceae)蒲桃屬(syzygium)的熱帶常綠果樹,別名洋蒲桃、南洋蒲桃、爪哇蒲桃、甜霧、水石榴等。蓮霧富含多種藥用成分,如黃酮類、查耳酮類、己烷等,具有止瀉、鎮(zhèn)痛、抗菌、抗高血糖、抗膽堿酯酶、抗炎、提高免疫力等功效。蓮霧果實色澤艷麗,形態(tài)獨特,清甜爽口,口感佳,富含酚類物質(zhì),是極具保健價值的水果之一,受國內(nèi)外消費者喜愛。在馬來西亞、泰國、印度尼西亞等地均有廣泛種植,是當?shù)毓麡I(yè)的重要組成部分,鮮果常銷往歐美國家。我國最早開始商品化種植蓮霧的地區(qū)是臺灣,近年來,隨著傳統(tǒng)熱區(qū)優(yōu)勢果樹如荔枝、龍眼、柑桔等價格的回落,蓮霧成為新興的熱帶果樹,栽培面積逐步擴增,主產(chǎn)區(qū)為臺灣、海南、福建、廣東和廣西等地,據(jù)不完全統(tǒng)計,2014年我國蓮霧種植面積6.87萬畝,產(chǎn)量13.6萬噸,每公斤售價30~50元,經(jīng)濟效益高,具發(fā)展?jié)摿Α?/p>
蓮霧有具有豐富的遺傳多樣性,但相關研究報道比較少。臺灣根據(jù)果實顏色將蓮霧分為大(深)紅種、淡紅種、粉紅種、青種和白種等五類(林正忠等,2004)。王家保等(2004)對海南的11份蓮霧資源進行同工酶研究,結(jié)果表明11份資源根據(jù)顏色不同聚成紅色果皮、白色果皮、綠色果皮3大類,紅色果皮與白色果皮親緣關系較綠色果皮近。但何橋等(2006)對12份蓮霧資源和2個蓮霧近緣種進行了issr分析,聚類分析結(jié)果顯示蓮霧并不以果皮顏色相同聚為一類,而以成熟期相近聚為一類,因此他指出成熟期可能在蓮霧親緣關系和分類地位中有重要作用。蓮霧自從爪哇、馬來西亞等國引入我國后,在長期的適應性栽培下產(chǎn)生了許多地方品種及資源,這些地方品種多以果實顏色命名,如‘大紅蓮霧’、‘粉紅蓮霧’、‘青蓮霧’等,這極有可能造成同名異物和同物異名,不僅給蓮霧種質(zhì)資源收集、保存、鑒定及利用造成難度,也制約了優(yōu)良品種的選育和推廣應用。
dna分子標記是鑒定種質(zhì)資源遺傳多樣性的重要手段,其中微衛(wèi)星序列(即簡單重復序列simplesequencerepeat,ssr)分子標記因其位點特異、高多態(tài)性、高穩(wěn)定性、重復性好、呈共顯性等優(yōu)點被廣泛應用于遺傳多樣性分析、品種鑒定、遺傳圖譜建立等方面。est-ssr標記來源于dna序列的轉(zhuǎn)錄區(qū),比基于基因組序列開發(fā)的ssr標記種間通用性更高,也更經(jīng)濟方便,近年來被廣泛地應用于多種植物的ssr分子標記開發(fā)上,在刺梨、洋蔥、藍靛果忍冬、絲瓜等園藝植物上均有報道。本發(fā)明利用轉(zhuǎn)錄組測序獲得的數(shù)據(jù)進行ssr標記搜索,分析其分布及組成特征,進行初步可用性評價,以期為蓮霧的品種鑒定、種質(zhì)資源多樣性分析、建立核心種質(zhì)和分子標記輔助育種奠定基礎。
技術實現(xiàn)要素:
本發(fā)明的目的在于提供蓮霧est-ssr分子標記,利用蓮霧轉(zhuǎn)錄組數(shù)據(jù)進行ssr標記開發(fā)能獲得較高頻率的ssr位點,且類型豐富,為蓮霧遺傳多樣性分析和遺傳圖譜構(gòu)建提供更加豐富可靠的標記選擇。
為實現(xiàn)上述目的,本發(fā)明采用如下技術方案:
蓮霧est-ssr分子標記編號為wassr3、wassr12-13、wassr37-39、wassr41-42、wassr44、wassr50、wassr55、wassr60、wassr63、wassr70、wassr72、wassr74、wassr80、wassr85、wassr87-88、wassr91-92,各編號所對應的蓮霧est-ssr分子標記的引物序列如seqidno.1-44所示。
所述的蓮霧est-ssr分子標記在蓮霧遺傳多樣性分析和遺傳圖譜構(gòu)建中的應用。
本發(fā)明的具體方法是:
(1)采用ctab法提取蓮霧基因組dna;
(2)使用misa程序(http://pgrc.ikp-gatersleben.de/misa)進行ssr位點搜索,以二至六核苷酸最少重復次數(shù)分別為6、5、5、5、和5次為標準進行搜索。用primer3.0軟件對ssr重復單元前后的序列進行引物設計及評價,每條ssr產(chǎn)生3條引物。引物序列長度18~27bp,gc含量40%~60%,退火溫度57~63℃,上、下游引物的tm值相差≤2℃,預期擴增產(chǎn)物長度100~280bp;且無二級結(jié)構(gòu)和二聚體;
(3)est-ssr引物篩選:pcr反應體系為20ul,其中2.5mmol/ldntp4μl,5utaq酶0.3μl,100ngdna1.5μl,10μmol/l的上下游引物各1μl,10×buffer(mg2+)2.5μl,加ddh2o補至20μl。pcr擴增程序為:95℃預變性5min;然后進行35個循環(huán),每個循環(huán)包括94℃變性30s,56℃退火30s(退火溫度因不同引物而異),72℃延伸1min;最后72℃延伸7min。
本發(fā)明的優(yōu)點在于:
本發(fā)明對來自3個蓮霧品種果實的21153條unigene(4.75mb)序列進行est-ssr搜索,得到11641個ssr位點,出現(xiàn)頻率為55.03%,高于藍靛果忍冬(32.51%)、刺梨(20.37%)、荔枝(16.35%)、柑橘(21.74%,5.2kb)、梨(7.1%,7.2%)等木本果樹,也高于蘿卜(23.79%)、絲瓜(14.97%)、辣椒(7.84%)、歐薄荷(9.88%)等草本植物。從前人對植物的研究結(jié)果來看,大多數(shù)植物的est-ssr以二、三核苷酸重復類型為主,而主導重復基序因物種而異。本發(fā)明發(fā)現(xiàn)蓮霧以單核苷酸重復類型(43.44%)為主,其次是二核苷酸重復類型(30.98%)和三核苷酸重復類型(24.38%),四、五和六核苷酸重復類型雖有出現(xiàn),但所占比例很小(1.21%),這與芙蓉李、杜仲和連翹的研究結(jié)果相似,不同于荔枝、枇杷和藍靛果忍冬。蓮霧的單核苷酸重復基序中,以a/t最為豐富,這與柑橘和芙蓉李等果樹研究結(jié)果一致;二核苷酸重復基序中ag/ct最多,與已有報道的多數(shù)果樹相同,不同于荔枝(ga/tc);三核苷酸重復基序以ccg/cgg為主,與獼猴桃、柑橘和草莓等以aag/ctt為主不同,也不同于荔枝(gaa/ttc)和梨(acc/ggt)。
本發(fā)明隨機從25734對引物種中選擇14~25bp的ssr引物100對進行合成,其中67對引物能擴增出理想pcr產(chǎn)物,有效擴增率為67.00%。其中,30對引物中22對ssr引物呈現(xiàn)多態(tài)性,占有效引物的73.33%。這個比率高于刺梨(52.17%)、芙蓉李(42.5%)、藍靛果忍冬(62.5%)、荔枝(66.67%)等多種果樹。這說明蓮霧est序列中的ssr位點較多,引物擴增效率較高,且其多態(tài)性也相對較高。22對多態(tài)性差異引物對30份蓮霧材料進行upgma聚類,被分為2大類,以遺傳距離0.68為閾值,第1類可分為4小類,以果皮顏色或來源地相近聚為一類,第2類可分為2小類,以果皮顏色不同來區(qū)分,比較準確的反映了30份蓮霧材料之間的差異。本發(fā)明利用蓮霧轉(zhuǎn)錄組數(shù)據(jù)開發(fā)出的ssr標記可用性較高,為蓮霧種質(zhì)資源遺傳多樣性研究、遺傳圖譜構(gòu)建、基因定位及克隆及分子標記輔助育種等奠定了基礎。
附圖說明
圖1引物63在30個蓮霧材料中的多態(tài)性。品種編號名稱見表1。
圖2供試蓮霧材料的upgma聚類圖,品種編號名稱見表1。
具體實施方式
1材料與方法
1.1轉(zhuǎn)錄組數(shù)據(jù)來源
蓮霧轉(zhuǎn)錄組數(shù)據(jù)來源于本課題組2016年對果實進行illumina高通量深度測序的結(jié)果。測序時采集‘紫紅’、‘黑珍珠’、‘青鉆’3個蓮霧品種果實,每個品種均取來自3個不同單株的蓮霧果實各20個,液氮速凍,-80℃保存。測序時,每個單株構(gòu)建1個文庫。測序委托北京百邁客生物科技有限公司采用illuminahiseqtm2500pe125系統(tǒng)進行rna-seq轉(zhuǎn)錄組測序(無參),采用trinity進行序列組裝,經(jīng)過濾獲得7.80g的有效數(shù)據(jù)。
1.2材料及其dna提取
用于ssr引物篩選和可用性評價的材料為福建省農(nóng)業(yè)科學院果樹研究所蓮霧種質(zhì)資源圃的30份種質(zhì)資源(表1)?;蚪Mdna提取采用ctab法進行。
表1蓮霧ssr多態(tài)性分析材料
1.3轉(zhuǎn)錄組ssr位點鑒別及ssr引物設計
使用misa程序(http://pgrc.ikp-gatersleben.de/misa)進行ssr位點搜索,以二至六核苷酸最少重復次數(shù)分別為6、5、5、5、和5次為標準進行搜索。用primer3.0軟件對ssr重復單元前后的序列進行引物設計及評價,每條ssr產(chǎn)生3條引物。引物序列長度18~27bp,gc含量40%~60%,退火溫度57~63℃,上、下游引物的tm值相差≤2℃,預期擴增產(chǎn)物長度100~280bp;且無二級結(jié)構(gòu)和二聚體。
1.4est-ssr引物篩選
pcr反應體系為20ul,其中2.5mmol/ldntp4μl,5utaq酶0.3μl,100ngdna1.5μl,10μmol/l的上下游引物各1μl,10×buffer(mg2+)2.5μl,加ddh2o補至20μl。pcr擴增程序為:95℃預變性5min;然后進行35個循環(huán),每個循環(huán)包括94℃變性30s,56℃退火30s(退火溫度因不同引物而異),72℃延伸1min;最后72℃延伸7min。pcr擴增產(chǎn)物用2%瓊脂糖檢測,6%變性聚丙烯酰胺凝膠檢測,160v電壓,3h,銀染顯色后觀察拍照。
1.5數(shù)據(jù)統(tǒng)計
ssr發(fā)生頻率為ssr的unigene數(shù)量與總unigene數(shù)量之比,ssr的出現(xiàn)頻率為ssr的個數(shù)與總unigene的數(shù)量比,ssr平均分布距離為1kb以上的unigene的堿基數(shù)與ssr數(shù)量之比。采用人工讀帶的方法,將電泳圖上可重復的清晰條帶記為“1”,同一位置無帶或不易分辨的弱帶記為“0”,建立原始數(shù)據(jù)矩陣。利用軟件ntsys2.10按系統(tǒng)聚類進行聚類繪圖。
2結(jié)果與分析
2.1轉(zhuǎn)錄組中ssr的分布及結(jié)構(gòu)特點
蓮霧轉(zhuǎn)錄組經(jīng)組裝后共獲得87538條unigene(序列總長約75156717bp),用misa軟件對1kb以上的unigene(21153條,序列全長為47491726bp)進行搜索,發(fā)現(xiàn)其中8115條unigene序列中含有11641個ssr位點,其中2773條unigene含有兩個或兩個以上的est-ssr位點。ssr發(fā)生頻率為38.36%,出現(xiàn)頻率為55.03%,平均4.08kb出現(xiàn)1個ssr,其中復合ssr有1432個,占12.3%。ssr重復類型6種均有,即單核苷酸至六核苷酸重復。其中單核苷酸、二核苷酸和三核苷酸重復出現(xiàn)頻率占優(yōu)勢,分別占總ssr的43.44%、30.98%和24.38%;四核苷酸、五核苷酸和六核苷酸重復類型數(shù)量較少,分別占總數(shù)的0.92%、0.14%和0.15%(表2)。
蓮霧轉(zhuǎn)錄組ssr重復單元的重復次數(shù)分布在5~23次之間,其中5~10次的ssr共有8753個,占總數(shù)的75.19%;其次為11~20次的ssr,共有2880個,占總數(shù)的24.74%;20次重復以上的僅有8個,僅占0.07%。蓮霧轉(zhuǎn)錄組ssr的長度主要集中在10~256bp,其中長度小于12bp的ssr有2873個(24.68%),長度在12~20bp的ssr達7094個,占總數(shù)的60.94%,長度在20bp以上的ssr有920個,只占7.90%。
表2蓮霧ssr的類型、數(shù)量及分布頻率
2.2轉(zhuǎn)錄組中ssr基序重復類型和頻率特征
蓮霧轉(zhuǎn)錄組中11641個ssr位點共含72種重復基序,單核苷酸至六核苷酸重復分別有2、4、10、24、15和17種。從分布頻率來看(表3),以單核苷酸重復類型a/t出現(xiàn)最多,占總ssr的40.15%,占單核苷酸重復基序的總數(shù)的92.43%。其次是二核苷酸重復類型ag/ct,占總ssr的26.99%,占二核苷酸總數(shù)的87.13%。此外,三核苷酸重復基序中以ccg/cgg、agg/cct和aag/ctt占優(yōu)勢,分別占三核苷酸總數(shù)的33.62%、20.05%和16.98%;四核苷酸、五核苷酸和六核苷酸重復基序分布較為分散,出現(xiàn)的頻率較低。
表3蓮霧轉(zhuǎn)錄中不同微衛(wèi)星重復基序(motif)出現(xiàn)的頻率
2.3蓮霧轉(zhuǎn)錄組ssr引物設計與篩選
利用primer3.0對含ssr位點的8115條unigene序列進行引物設計,共設計出引物25734對。隨機挑選100對不同重復單元(二、三、四、五、六核苷酸)的引物對蓮霧‘粉紅種’dna進行ssr-pcr擴增以驗證其有效性。結(jié)果表明76對引物實現(xiàn)有效擴增,占100對ssr引物的76%。在76對有效擴增引物中,67對(88.12%)pcr擴增產(chǎn)物與預期大小相符,有9對(13.43%)擴增產(chǎn)物長度超過預期。
2.4多態(tài)性分析
選取30份蓮霧,利用30對有效的est-ssr引物進行擴增及多態(tài)性評價。其中22對引物存在多態(tài)性差異(表4),占有效擴增引物的73.33%。每對引物產(chǎn)生的多態(tài)性片段數(shù)在2~6之間,23對引物共得到63條條帶,其中多態(tài)性片段52個,每對引物平均產(chǎn)生2.36個多態(tài)性片段,圖1為引物63的擴增情況。
表422對蓮霧ssr引物信息
利用22對多態(tài)性ssr引物對30份蓮霧材料進行聚類分析,在遺傳距離0.60處,供試材料被分成2大類(圖2)。第1類包含26份材料,以遺傳距離0.68為閾值,該類被分為4小類,其中以‘印尼大葉’、‘黑鉆石’和‘紫紅’為代表的紅色果皮蓮霧聚為一類,以‘翡翠’、‘泰國青種’和‘pethjinda’為代表的綠色果皮蓮霧聚在一起,‘龍文實生’和‘印度紅’歸為一類,來源于同一果園的‘長泰青種’、‘青鉆’和‘長泰粉紅種’聚為一類。第2類包含4份材料,其中紅色果皮蓮霧(‘紅寶石’、‘香水’、‘農(nóng)科4號’)歸為一類,‘白蓮霧’果皮為白色,自成一類。
以上所述僅為本發(fā)明的較佳實施例,凡依本發(fā)明申請專利范圍所做的均等變化與修飾,皆應屬本發(fā)明的涵蓋范圍。
sequencelisting
<110>福建省農(nóng)業(yè)科學院果樹研究所
<120>蓮霧est-ssr分子標記
<130>44
<160>44
<170>patentinversion3.3
<210>1
<211>20
<212>dna
<213>人工序列
<400>1
tgtttcaactcgcacgactc20
<210>2
<211>20
<212>dna
<213>人工序列
<400>2
aaacggttttcattgatggc20
<210>3
<211>20
<212>dna
<213>人工序列
<400>3
gtgtcatcgaaaccctccaa20
<210>4
<211>20
<212>dna
<213>人工序列
<400>4
ttgaatcttgcaagcgactg20
<210>5
<211>20
<212>dna
<213>人工序列
<400>5
gtcatgcttgctctgtccaa20
<210>6
<211>20
<212>dna
<213>人工序列
<400>6
ttctggattgcaggaacctt20
<210>7
<211>20
<212>dna
<213>人工序列
<400>7
gatggctggtgactcaggtt20
<210>8
<211>20
<212>dna
<213>人工序列
<400>8
gaccctttccttgagtggaa20
<210>9
<211>23
<212>dna
<213>人工序列
<400>9
ggaaaaggagagaattttcttga23
<210>10
<211>20
<212>dna
<213>人工序列
<400>10
ttttcccccatgagagtgag20
<210>11
<211>20
<212>dna
<213>人工序列
<400>11
gggttttcagccaaaaattg20
<210>12
<211>20
<212>dna
<213>人工序列
<400>12
cgagcgagagagagagatgg20
<210>13
<211>20
<212>dna
<213>人工序列
<400>13
gagcttgtttatcgaaggcg20
<210>14
<211>20
<212>dna
<213>人工序列
<400>14
aaactggcgacaaaaacgag20
<210>15
<211>20
<212>dna
<213>人工序列
<400>15
gtcgcgtcaccattatttca20
<210>16
<211>20
<212>dna
<213>人工序列
<400>16
ggtttagttaagggcggctc20
<210>17
<211>20
<212>dna
<213>人工序列
<400>17
gaggagtcgctgaactgtcc20
<210>18
<211>20
<212>dna
<213>人工序列
<400>18
cgcacccactgttttaggat20
<210>19
<211>20
<212>dna
<213>人工序列
<400>19
aagccgaagatgaagacgaa20
<210>20
<211>20
<212>dna
<213>人工序列
<400>20
ggacatatatccgcggtttg20
<210>21
<211>20
<212>dna
<213>人工序列
<400>21
atatgaatcccgggccttac20
<210>22
<211>20
<212>dna
<213>人工序列
<400>22
ctcccgtctctccacaacat20
<210>23
<211>20
<212>dna
<213>人工序列
<400>23
tggtgtctgtaactgctgcc20
<210>24
<211>20
<212>dna
<213>人工序列
<400>24
agttcttggggaggaatcgt20
<210>25
<211>20
<212>dna
<213>人工序列
<400>25
ttggtaaatcggcatcttcc20
<210>26
<211>20
<212>dna
<213>人工序列
<400>26
accgaaaagggacaaggagt20
<210>27
<211>20
<212>dna
<213>人工序列
<400>27
ggctcacttgtgcaacaaaa20
<210>28
<211>20
<212>dna
<213>人工序列
<400>28
cgactgtccacattggtgtc20
<210>29
<211>20
<212>dna
<213>人工序列
<400>29
accttttcatgcaaattccg20
<210>30
<211>20
<212>dna
<213>人工序列
<400>30
aggatcatgcattcggtttc20
<210>31
<211>20
<212>dna
<213>人工序列
<400>31
gggtttgggtttgagttgtg20
<210>32
<211>20
<212>dna
<213>人工序列
<400>32
aaaagcaaacggggctactt20
<210>33
<211>20
<212>dna
<213>人工序列
<400>33
gtcgagaggaaggagtggaa20
<210>34
<211>20
<212>dna
<213>人工序列
<400>34
tcgttataatcgtccggctt20
<210>35
<211>20
<212>dna
<213>人工序列
<400>35
ctccaccacaaccacaacag20
<210>36
<211>20
<212>dna
<213>人工序列
<400>36
ggttcacgttctctcgaagc20
<210>37
<211>20
<212>dna
<213>人工序列
<400>37
gcttttaaggaaccgggaac20
<210>38
<211>20
<212>dna
<213>人工序列
<400>38
agattcccactgaatgtccg20
<210>39
<211>22
<212>dna
<213>人工序列
<400>39
tttctgagatttgacgaggaaa22
<210>40
<211>20
<212>dna
<213>人工序列
<400>40
actgcttgcaccgttgaact20
<210>41
<211>20
<212>dna
<213>人工序列
<400>41
tgagaaacccacaaagtccc20
<210>42
<211>20
<212>dna
<213>人工序列
<400>42
gcgtcaaatcccaatcactt20
<210>43
<211>20
<212>dna
<213>人工序列
<400>43
tctagatctttgagcgggga20
<210>44
<211>20
<212>dna
<213>人工序列
<400>44
aatgccgtcaatttctcacc20