專利名稱:抗稻瘟病的水稻基團的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及調(diào)控植物稻瘟病抗性的基團,由所述基因編碼的蛋白質(zhì),及其用途。
稻瘟病(Blast disease)是植物(例如水稻)的一種嚴重疾病,該病由稻瘟病真菌Magnaporthe grisea引起。該病實際上損害了日本和很多其他水稻種植國的水稻產(chǎn)量。這種損害在低溫和高濕度環(huán)境尤其嚴重。這種疾病已經(jīng)通過培育抗性品種和應(yīng)用農(nóng)藥得以清除。起初,存在抗該病的水稻品系。這些品系和品種具有抗特別種稻瘟病真菌的基團,這些基團曾被研究過很長時間。目前,約30種基因經(jīng)鑒定屬稻瘟病抗性基團(Kinoshita,水稻遺傳學(xué)通訊,716-57(1990),Iwata,水稻遺傳學(xué)通訊,1312-35(1996),Iwata,水稻遺傳學(xué)通訊,147-22(1997))。這些基因被用于培育高抗性品種,結(jié)果,培育出大量抗性品種。然而,由于稻瘟病真菌新種的出現(xiàn),導(dǎo)入的抗性基因逐漸失效(抗性品種的失效)。而且,稻瘟病抗性表達的分子機理以及稻瘟病真菌與抗性基因之間的相互作用仍然不清楚。
抗性基團Pi-b定位在水稻染色體2的長臂末端,并對由日本鑒定的除033b之外的所有稻瘟病真菌表現(xiàn)出抗性(表1)。
這種基因存在于印度尼西亞和馬來西亞的Indica品種例如Engkatek,Milek kuning,Tjina,和Tjahaja中。在日本,一種Pi-b純合并具有敏感品種Sasanishiki遺傳背景的TohokuIL9品系,已經(jīng)由Miyagi Prefectural Furukawa農(nóng)業(yè)實驗站培育出來。
然而,抗性表達機理還不清楚,而且Pi-b基因也沒有分離出來。
表1真菌菌株品種 基因 Ine Cho 2101 Ine TH89 Cho F67- Ine P-2b Ai7484- 69- -472-41 68- 57168 -13491A 150 182#003 #007 #013 #031 #033 #035 #047 #101 #303 #477b+Shin 2 - S S S S S S S S S SAichiasahi Pi-aS S S R S R S R S SInabawase Pi-iR S R R R S S R R SKanto 51 Pi-kR R S S S S R R R STsuyuake Pi-km R R R S S S R R R SFukunishikiPi-zR R R R R R S R R SYashiromochi Pi-ta R R R R R R R R S RPi No.4Pi-ta2 R R R R R R R R S RToride1Pi-zt R R R R R R R R R SOuu 316Pi-bR R R R S R R R R RR抗性S敏感性本發(fā)明的目的是提供一種抗稻瘟病的抗性基因Pi-b,與之功能相當?shù)幕?,及由上述基因編碼的蛋白質(zhì)。本發(fā)明的另一目的是用該基因制備抗稻瘟病的植物。
本發(fā)明人利用基于圖譜的克隆從大染色體區(qū)分離出基因Pi-b,從而成功地分離到稻瘟病抗性基因。具體地說,本發(fā)明人還用分子標記進行了連鎖分析。首先,指定特異標記之間的染色體區(qū)為Pi-b基因座。然后,在指定區(qū)附近排列粘??寺∫詷?gòu)建物理圖譜。然后確定所述克隆的核苷酸序列,以尋找包含核苷酸結(jié)合位點(NBS)的Pi-b候選基因區(qū),所述結(jié)合位點發(fā)現(xiàn)普遍存在于幾種植物的抗性基因中。然后用抗稻瘟病品種構(gòu)建cDNA文庫。利用上述候選基因組區(qū)域作為探針篩選基因文庫,分離與所述基因組區(qū)相對應(yīng)的cDNA。在分離到的cDNA的核苷酸序列的基礎(chǔ)上制備寡核苷酸引物,利用該引物對由稻瘟病敏感和抗性品種制備的每個mRNA級分進行RT-PCR,以分析分離到的Pi-b的候選cDNA的表達模式。特異性擴增抗性品種中的cDNA。因此,本發(fā)明人發(fā)現(xiàn)分離到的cDNA克隆是Pi-b基因。本發(fā)明人還發(fā)現(xiàn),可以利用分離到的基因或其同源基因產(chǎn)生抗稻瘟病植物,因為在分離到的基因和稻瘟病抗性之間存在密切關(guān)系。
本發(fā)明涉及水稻稻瘟病抗性基因Pi-b,其同源基因,以及由所述基因編碼的蛋白質(zhì)。本發(fā)明還涉及利用所述基因制備抗稻瘟病植物的方法。本發(fā)明具體涉及下列內(nèi)容(1)賦予植物抗稻瘟病抗性的蛋白質(zhì),其中所述蛋白質(zhì)包括SEQ ID NO1所示的氨基酸序列,或其中一個或多個氨基酸被取代、缺失和/或添加得到的修飾序列,(2)賦予植物抗稻瘟病抗性的蛋白質(zhì),其中所述蛋白質(zhì)由可與包含SEQ IDNO2和/或NO3核苷酸序列的DNA雜交的DNA編碼,(3)編碼蛋白質(zhì)(1)或(2)的DNA,(4)包含DNA(3)的載體,(5)攜有載體(4)的宿主細胞,(6)(5)的宿主細胞,其中所述宿主細胞為植物細胞,(7)制備蛋白質(zhì)(1)或(2)的方法,所述方法包括培養(yǎng)宿主細胞(5),(8)包括宿主細胞(6)的經(jīng)轉(zhuǎn)化植物,(9)植物(8),其中所述植物為禾本科(Poaceae),(10)植物(8),其中所述植物為禾木科稻屬(P.oryza),(11)植物(8)、(9)或(10)之任一種,其中所述植物表現(xiàn)出抗稻瘟病的抗性,(12)與蛋白質(zhì)(1)或(2)結(jié)合的抗體,和(13)包括至少15個核苷酸的DNA,其中所述DNA與DNA(3)特異性雜交。
圖的簡述
圖1顯示了初步連鎖分析后推定的Pi-b基因座區(qū)域。
圖2顯示了精密連鎖分析后推定的Pi-b基因座區(qū)域。
圖3所示為Pi-b候選cDNA在稻瘟病敏感和抗性品種中表達的RT-PCR分析結(jié)果的電泳模式照片。A中使用了包括cDNA克隆c23第二內(nèi)含子的引物。B中使用了特異于4.6kb片段的引物,該引物包含緊鄰c23區(qū)的NBS。泳道1和2中使用的模板由來源于Sasanishiki和TohokuIL9的基因組DNA組成;泳道3和4中使用的模板分別為來源于TohokuIL9的粘??寺?40和#147;泳道5的模板為包含TohokuIL9的cDNAc23的質(zhì)粒DNA;泳道6的模板為由TohokuIL9未處理葉制備的mRNA(200ng;下文的mRNA使用同樣量);泳道7,8和9的模板分別為用水稻稻瘟真菌接種TohokuIL9 12小時、24小時、或4天后,由其葉制備的mRNA;泳道10的模板來自Sasanishiki未處理葉的mRNA;泳道10和11的模板分別為用真菌接種Sasanishiki 12小時和24小時后,由其葉制備的mRNA;泳道12為無菌水。從上到下,分子量標記的大小分別為1.4k、1.0k、0.9k和0.6k。
圖4為Pi-b基因與已知抗性基因的保守區(qū)的比較。
發(fā)明詳述本發(fā)明涉及賦予植物抗稻瘟病表型的蛋白質(zhì)。由“Pi-b”基因編碼的包括在本發(fā)明范圍的蛋白質(zhì)內(nèi)(下文稱為Pi-b蛋白)的氨基酸序列如SEQ IDNO1所示。已知編碼賦予水稻抗稻瘟病表型之蛋白質(zhì)的Pi-b基因位于水稻染色體2大區(qū)域的某處。本發(fā)明人首次成功地鑒定了其基因座,并分離到單個基因。Pi-b蛋白賦予水稻對除033b之外的日本所有種稻瘟病真菌品種具有抗性。這是目前鑒定的基因中最寬范圍的抗性(表1)。Pi-b蛋白的這些特征表明Pi-b蛋白或功能與其等同的蛋白質(zhì)非常適于制備抗稻瘟病的植物品種。
制備與Pi-b蛋白功能等同的蛋白質(zhì)是可能的,例如,可使用下述方法。在Pi-b蛋白的氨基酸序列中導(dǎo)入突變的方法是本領(lǐng)域技術(shù)人員的公知技術(shù)。即本領(lǐng)域技術(shù)人員能夠通過定點誘變技術(shù)(Kramer,W.和Fritz,H.-J.經(jīng)帶缺口的雙鏈體DNA構(gòu)建寡核苷酸定向誘變,酶學(xué)方法154350-367,(1987))改變Pi-b蛋白的氨基酸序列(SEQ ID NO1)以制備突變蛋白,其在功能上與Pi-b蛋白等同。氨基酸突變可以自發(fā)發(fā)生。本發(fā)明的蛋白質(zhì)包括使野生型Pi-b蛋白氨基酸序列的一個或多個氨基酸被取代、缺失或添加得到,且與野生型Pi-b蛋白功能等同的蛋白質(zhì)。該蛋白質(zhì)中改變的氨基酸殘基的位置和數(shù)目沒有限制,只要改變后的蛋白質(zhì)與野生型Pi-b蛋白功能等同即可。通常改變的氨基酸殘基不超過50個,優(yōu)選不超過30個,更優(yōu)選不超過10個,最優(yōu)選不超過3個。此處所用的術(shù)語“與野生型Pi-b蛋白功能上等同”指改變后的蛋白質(zhì)賦予植物抗稻瘟病的抗性?!百x予植物抗稻瘟病的抗性”指該蛋白質(zhì)賦予至少一個植物品種對至少一種稻瘟病真菌的抗性。被賦予抗性的植物優(yōu)選為禾本科,更優(yōu)選禾本科水稻??梢酝ㄟ^下述幾條判斷是否蛋白質(zhì)賦予植物抗稻瘟病的抗性,例如,(i)將某種稻瘟病真菌形成的孢子懸液用直接噴灑在幼小植物(例如,三到四周大的稻苗)上以接種稻瘟病真菌,(ii)接種后立即在25℃ 100%濕度下將接種后的植物培養(yǎng)24小時,然后在正常條件下培養(yǎng)約兩周,(iii)觀察是否局部損傷由于壞死而停止生長,這是含有抗性基因的植物超敏反應(yīng)的結(jié)果,或者局部損傷特異性置仍繼續(xù)生長導(dǎo)致植物死亡(無抗性基因的植物)。
同時,雜交技術(shù)(Southern,E.M.,分子生物學(xué)雜志,98,503,(1975))和聚合酶鏈反應(yīng)(PCR)技術(shù)(Saiki,R.K.等,科學(xué),2301350-1354(1985);Saiki,R.K.等,科學(xué),239487-491(1988))是本領(lǐng)域技術(shù)人員已知的制備功能等同蛋白質(zhì)的其它方法。即本領(lǐng)域技術(shù)人員通常能夠利用Pi-b基因的核苷酸序列(SEQ ID NO2或3)或其片段作為探針,或利用與Pi-b基因(SEQ IDNO2或3)特異性雜交的寡核苷酸引物,從水稻或其他植物中分離與Pi-b基因高度同源的DNA,從所述DNA獲得與Pi-b蛋白功能等同的蛋白質(zhì)。本發(fā)明的蛋白質(zhì)包括利用雜交技術(shù)或PCR技術(shù)分離到的與Pi-b蛋白功能等同的蛋白質(zhì)。此處所述的“與Pi-b蛋白功能等同”指通過雜交技術(shù)或PCR技術(shù)分離到的蛋白質(zhì)賦予植物抗稻瘟病抗性。除水稻外,利用上述技術(shù)分離基因所用的植物包括可以作為稻瘟病真菌宿主的作物,例如大麥屬、小麥屬、狗尾草屬、黍?qū)?、稗屬、和薏苡?作物病害大全(1998),Kishi,K.編,Japan Agriculture Education Association)。通常,由分離到的基因編碼的蛋白質(zhì)當功能上與Pi-b蛋白等同時,其氨基酸水平也與Pi-b蛋白高度同源。高度同源指同源性優(yōu)選為30%或更高,更優(yōu)選50%或更高,更優(yōu)選70%或更高,最優(yōu)選90%或更高。
本發(fā)明的蛋白質(zhì)可以用本領(lǐng)域技術(shù)人員已知的方法,通過重組DNA技術(shù)制備為重組蛋白質(zhì),也可以為天然蛋白質(zhì)。例如,可以通過在合適的表達載體中插入編碼本發(fā)明蛋白質(zhì)的DNA,將所述載體導(dǎo)入合適的細胞,然后從所述轉(zhuǎn)化細胞中純化蛋白質(zhì)以制備重組蛋白質(zhì)。天然蛋白質(zhì)可以如下制備,例如,將表達本發(fā)明蛋白質(zhì)的細胞(例如水稻細胞)提取物上親合柱,該親合柱由用重組蛋白質(zhì)或其片段免疫合適動物制備的抗體裝填,然后從所述柱上純化結(jié)合的蛋白質(zhì)。
本發(fā)明也涉及編碼本發(fā)明蛋白質(zhì)的DNA。本發(fā)明的DNA沒有限制,包括基因組DNA、cDNA、以及化學(xué)合成的DNA,只要該DNA編碼本發(fā)明的蛋白質(zhì)即可。本發(fā)明的Pi-b cDNA和Pi-b基因組DNA的核苷酸序列分別如SEQ ID NO2和NO3所示。
本領(lǐng)域技術(shù)人員可以用標準方法制備基因組DNA或cDNA。例如,可以用兩個步驟制備基因組DNA。首先,利用含稻瘟病抗性基因的水稻品種(例如TohokuIL9)葉提取的基因組DNA構(gòu)建基因組文庫(使用載體例如質(zhì)粒、噬菌體、粘?;駼AC)。其次,利用以編碼本發(fā)明蛋白質(zhì)(例如SEQ IDNO1或2)的DNA的核苷酸序列為基礎(chǔ)制備的探針,對上述擴展文庫進行菌落雜交或噬斑雜交?;蛘?,利用特異性引物對編碼本發(fā)明蛋白質(zhì)(例如SEQID NO1或2)的DNA進行PCR來制備基因組DNA。cDNA也可以利用下述方法制備,例如,用含稻瘟病抗性基因的水稻品種(例如TohokuIL9)葉提取的mRNA合成cDNA,然后將該cDNA插入載體例如λZAP以構(gòu)建cDNA文庫,然后對該擴展文庫進行菌落雜交或噬斑雜交,或者如上述方法進行PCR。
本發(fā)明的DNA可以用來制備重組蛋白質(zhì)或生產(chǎn)抗稻瘟病的轉(zhuǎn)化植物。通常,通過將編碼本發(fā)明蛋白質(zhì)的DNA插入合適的表達載體,將所述載體導(dǎo)入合適的細胞,培養(yǎng)轉(zhuǎn)化細胞,純化表達出來的蛋白以制備重組蛋白質(zhì)。重組蛋白質(zhì)可以表達成與其他蛋白質(zhì)融合的蛋白質(zhì)以便于純化,例如,在大腸桿菌中與麥芽糖結(jié)合蛋白融合的蛋白質(zhì)(New England Biolabs,USA,載體pMAL系列),與谷胱甘肽-S-轉(zhuǎn)移酶(GST)融合的蛋白質(zhì)(Amersham Pharmacia Biotech,載體pGEX系列),或者經(jīng)組氨酸標記的蛋白質(zhì)(Novagen,pET系列)。對宿主細胞沒有限制,只要該細胞適于表達重組蛋白質(zhì)即可。除了上述之腸桿菌外,還可以使用酵母菌或各種動物、植物、或昆蟲細胞??梢杂酶鞣N本領(lǐng)域技術(shù)人員已知的方法將載體導(dǎo)入宿主細胞。例如,可以用鈣離子轉(zhuǎn)化法(Mandel,M.和Higa,A.,分子生物學(xué)雜志53158-162,(1970);Hanahan,D.,分子生物學(xué)雜志166557-580,(1983))將載體導(dǎo)入E.Coli。在宿主細胞表達的重組重白質(zhì)可以用已知方法純化。當重組蛋白質(zhì)被表達為與麥芽糖結(jié)合蛋白或其他蛋白質(zhì)融合的形式時,可以很容易地用親合層析純化該重組蛋白質(zhì)。
可以用本發(fā)明的DNA生產(chǎn)抗稻瘟病的轉(zhuǎn)化植物。換句話說,將編碼本發(fā)明蛋白質(zhì)的DNA插入合適的載體,將該載體導(dǎo)入植物細胞,再生所得的轉(zhuǎn)化植物細胞。對所述載體沒有限制,只要該載體能夠表達插入植物細胞的基因即可。例如,可以使用含有在植物細胞中組成型基因表達的啟動子(例如花椰菜花葉病毒35S啟動子),或者由外源刺激物誘導(dǎo)的啟動子的載體。對用載體轉(zhuǎn)染的植物細胞沒有限制,但最好是禾本科植物細胞。除了水稻,還可以包括下列細胞,例如,大麥屬、小麥屬、狗尾草屬、黍?qū)?、稗屬、和薏苡屬。此處所說的“植物細胞”包括各種形式的植物細胞,例如培養(yǎng)的細胞懸浮液、原生質(zhì)體、葉切片、和愈傷組織??梢杂靡阎椒▽⑤d體導(dǎo)入植物細胞,例如聚乙二醇法,電穿孔法、農(nóng)桿菌介導(dǎo)的轉(zhuǎn)移,以及微粒轟擊??梢岳靡阎椒?,使轉(zhuǎn)化的不同種類的植物細胞再生為植物(Toki等,(1995)植物生理學(xué)1001503-1507)。
另外,本發(fā)明涉及與本發(fā)明蛋白質(zhì)結(jié)合的抗體。本發(fā)明抗體可以是多克隆抗體,也可以是單克隆抗體。多克隆抗體可以用下述方法制備,用本發(fā)明的純化蛋白質(zhì)或其片段免疫免疫動物例如兔,一定時間后取血,除去凝血塊。單克隆抗體可以用下述方法制備,將骨髓瘤細胞與被上述蛋白質(zhì)或其片段免疫過的動物的抗體生成細胞融合,分離表達所需抗體的單克隆細胞(雜交瘤),從所述細胞中提取抗體。獲得的抗體可以用于純化或檢測本發(fā)明的蛋白質(zhì)。
另外,本發(fā)明還涉及與編碼本發(fā)明蛋白質(zhì)的DNA特異性雜交的DNA,其包括至少15個核苷酸殘基。此處所說的“特異性雜交”指在標準雜交條件下,最好是嚴緊雜交條件下,該DNA可以與編碼本發(fā)明蛋白的DNA雜交,而不與任何編碼其他蛋白質(zhì)的DNA雜交。該DNA可以用于,例如,作為探針以檢測或分離編碼本發(fā)明蛋白質(zhì)的DNA,或者作為PCR擴增的引物。DNA的一個例子為由至少15個與SEQ ID NO2或NO3的核苷酸序列互補的核苷酸組成。
本發(fā)明提供了稻瘟病抗性基因Pi-b,其功能等同基因,以及由上述基因編碼的蛋白質(zhì)。本發(fā)明的抗病基因賦予植物對廣譜的稻瘟病真菌抗性。因此,例如,當將該基因?qū)胗幸孀魑锢缢緯r,所述基因?qū)刂圃摬『σ约疤岣咦魑锂a(chǎn)量將極為有利。
下面將參考實施例對本發(fā)明作詳細描述,但該實施例不構(gòu)成對本發(fā)明的限制。
實施例1初步連鎖分析為確定Pi-b基因在水稻染色體2連鎖圖譜中的大概位置,首先利用DNA標記進行連鎖分析。使用的來源為94個植株的分離群體,得自Sasanishiki與Sasanishiki和TohokuIL9之間雜交的F1代之間兩個回交的F1代的自體受精。連鎖分析表明Pi-b基因定位于染色體2的RFLP標記C2782和C379之間,其間被R1792、R257和R2821共分隔(cosegregate)(日本育種協(xié)會,第87次會議,圖1)。
實施例2精密連鎖分析對大量分離的群體進行分析以分離基因。從上述94個植株群體中,選擇出20個對Pi-b基因座為雜的植株,將約20,000個分離群體的種子,包括自體受精種子用于分析(日本育種協(xié)會,第89次會議)。分析中,使用了集中取樣法(pool sampling method)以減小任務(wù)量(Churchill等,美國國家科學(xué)進展9016-20(1993))。
為增加連鎖分析的精確性,需要增加目標基因附近的DNA標記的數(shù)量,并增大取樣的群體。因此,亞克隆經(jīng)初步連鎖分析確定的具有Pi-b基因座的YAC克隆,以增加Pi-b基因附近的DNA標記數(shù)量(Monna等,遺傳學(xué)理論和應(yīng)用94170-176(1997))。利用大群體進行連鎖分析,將Pi-b基因座縮小到RFLP標記S1916和G7073之間的區(qū)域。另外,Pi-b基因被三種RFLP標記共同分隔開(G7010、G7021和G7023;圖2)。
實施例3用粘??寺∨帕蠵i-b基因座為進一步縮小Pi-b基因座的范圍,使用粘??寺∵M行排列。從含有抗性基因的TohokuIL9中,用CTAB法提取基因組DNA。然后用限制性核酸內(nèi)切酶Sau3A部分消化上述DNA。用蔗糖密度梯度離心法從消化產(chǎn)物中分級分離約30-50kb的片段。得到的DNA片段和粘粒載體SuperCos(Stratagene,Wahl等,Proc.Natl.Acad.Sci.USA 842160-2164(1987))用于構(gòu)建粘粒文庫。利用Pi-b基因座附近的五個DNA克隆(S1916、G7010、G7021、G7023和G7030)作為探針篩選粘粒文庫。結(jié)果選擇出六個粘??私?COS140、COS147、COS117、COS137、COS205和COS207)。這些克隆的限制性圖譜的構(gòu)建和其重疊區(qū)域的檢測表明,Pi-b基因座位于由三個克隆(COS140、COS147、和COS117;圖2)覆蓋的基因組區(qū)域。
實施例4序列分析確定候選基因組區(qū)對推測含有Pi-b基因的三個排列的粘粒克隆進行亞克隆,部分分析它們的核苷酸序列。利用在公共核苷酸數(shù)據(jù)庫中進行BLAST同源性檢索,分析獲得的核苷酸序列。結(jié)果表明,從COS140獲得的2.3kb克隆的部分核苷酸序列和從COS147獲得的4.6kb克隆的部分核苷酸序列包含核苷酸結(jié)合位點(NBS),所述位點普遍存在于幾種植物的抗性基因中,例如,擬南芥屬(Arabidoposis)中的PRM1病抗性基因中。因此,這些核苷酸序列有望成為Pi-b基因的候選區(qū)。
實施例5cDNA的分離和序列分析分離cDNA,以檢測是否核苷酸序列分析揭示的候選區(qū)在抗性品種TohokuIL9中得以表達。使抗性品種TohokuIL9發(fā)芽,待小苗長出四片葉子時,按照標準方法接種稻瘟病真菌TH68-141(003種)。然后在接種后的三個時間點,即6小時、12小時、和24小時,收集葉片。從樣品中提取信使RNA,并構(gòu)建cDNA文庫。進一步亞克隆候選基因組區(qū)的2.3kb的片段,得到1kb的片段(SEQ ID NO3的3471-4507位),將該片段用作篩選上述文庫的探針。結(jié)果選擇出八個cDNA克隆。該克隆的序列分析表明,c23的核苷酸序列與粘??私礐OS 140的核苷酸序列完全配對。因此確定候選基因組區(qū)在TohokuIL9中表達。選擇出的c23克隆約有4kb,估計包含該基因的幾乎全部區(qū)域。確定了該克隆的全部核苷酸序列(SEQ ID NO2)。
實施例6候選cDNA表達模式的分析在敏感品種(Sasanishiki)和抗性品種(TohokuIL9)中,發(fā)現(xiàn)候選cDNA區(qū)的不同表達模式。用003種稻瘟病真菌接種處于4葉期的上述兩個品種,接種后6小時、12小時和24小時,收集葉片。然后提取mRNA,用作RT-PCR的模板。在cDNA克隆c23核苷酸序列基礎(chǔ)上設(shè)計了引物SEQ ID NO4/5′-AGGGAAAAATGGAAATGTGC-3′(反義鏈)和SEQ ID NO5/5′-AGTAACCTTCTGCTGCCCAA-3′(有義鏈)用于RT-PCR以特異性擴增該區(qū)。PCT條件如下94℃2分鐘循環(huán)1次;94℃1分鐘,55℃2分鐘,72℃3分鐘,循環(huán)30次;72℃7分鐘循環(huán)1次。PCR后,檢測到抗性品種TohokuIL9中的特異性擴增,但用敏感品種(Sasanishiki;圖3)的mRNA沒有檢測到擴增。這表明cDNA克隆c23在抗性品種中特異性表達。同時,在包含NBS并臨近c23區(qū)的4.6kb片段的核苷酸序列基礎(chǔ)上設(shè)計了引物SEQID NO6/5′-TTACCATCCCAGCAATCAGC-3′(有義鏈)和SEQ ID NO7/5′-AGACACCCTGCCACACAACA-3′(反義鏈),利用該引物進行RT-PCR。該4.6kb片段區(qū)既不在敏感品種(Sasanishiki)中擴增,也不在抗性品種(TohokuIL9;圖3)中擴增。進一步表明克隆c23的相應(yīng)基因組區(qū)是Pi-b基因座。
實施例7Pi-b候選基因的基因組DNA的序列分析確定了對應(yīng)于cDNA克隆c23的基區(qū)組區(qū)的完全核苷酸序列。用五種不同的限制酶酶切,對粘??寺OS 140進行亞克隆,盡可能地從兩端確定得到的亞克隆重的核苷酸序列。不適合上述分析的區(qū)域,通過刪除切割得更短后,再進行DNA測序。確定的區(qū)域擴展到10.3kb(SEQ ID NO3)。
實施例8Pi-b基因的結(jié)構(gòu)Pi-b的候選cDNA c23全長有3925個堿基對,并含有3618個堿基對的ORF,該ORF包含由兩個內(nèi)含子分隔開的三個外顯子。Pi-b翻譯產(chǎn)物為含有1205個氨基酸殘基的蛋白質(zhì)(SEQ ID NO1),該蛋白質(zhì)含有在很多抗性基因中可發(fā)現(xiàn)的兩個NBS(386-395位氨基酸的P-環(huán),和474-484位的激酶2),以及三個保守區(qū)(1區(qū)在503-513位氨基酸,2區(qū)在572-583位,3區(qū)在631-638位)。這些區(qū)域與已知抗性基因例如RPM1的保守區(qū)表現(xiàn)高度同源性(圖4)。同時,該基因在3′-側(cè)還含有12個不完全的、富含亮氨酸的重復(fù)序列(LRR在755-1058氨基酸位置)。這些結(jié)構(gòu)與以前報道的NBS-LRR類抗性基因具有非常高度的同源性?;谏鲜鼋Y(jié)果,本發(fā)明人論斷上述經(jīng)分析的cDNA和對應(yīng)的基因組區(qū)為稻瘟病抗性基因Pi-b。
序列表(1)一般資料(i)申請人NAKAGAWARA Masahiro,Director General of THENATIONAL INSTITUTE OF AGROBIOLOGICAL RESOURCES(NIAR),MAFF SOCIETY for TECHNO-INNOVATION of AGRICUTURE,F(xiàn)ORESTRYand FISHERIES(ii)發(fā)明題目抗稻瘟病的水稻基因(iii)序列數(shù)7(v)計算機可讀形式(A)介質(zhì)類型軟盤-3.50英寸,1.44Mb內(nèi)存(B)計算機IBMPC(C)操作系統(tǒng)MS-DOS 3.30版本或更高(D)軟件(2)SEQ ID NO1的資料(i)序列特征(A)長度1205(B)類型氨基酸(D)拓撲結(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO1Met Met Arg Ser Phe Met Met Glu Ala His1 5 10Glu Glu Gln Asp Asn Ser Lys Val Val Lys Thr Trp Val Lys Gln Val15 20 25Arg Asp Thr Ala Tyr Asp Val Glu Asp Ser Leu Gln Asp Phe Ala Val
30 35 40His Leu Lys Arg Pro Ser Trp Trp Arg Phe Pro Arg Thr Leu Leu Glu45 50 55Arg His Arg Val Ala Lys Gln Met Lys Glu Leu Arg Asn Lys Val Glu60 65 70Asp Val Ser Gln Arg Asn Val Arg Tyr His Leu Ile Lys Gly Ser Ala75 80 85 90Lys Ala Thr Ile Asn Ser Thr Glu Gln Ser Ser Val Ile Ala Thr Ala95 100 105Ile Phe Gly Ile Asp Asp Ala Arg Arg Ala Ala Lys Gln Asp Asn Gln110 115 120Arg Val Asp Leu Val Gln Leu Ile Asn Ser Glu Asp Gln Asp Leu Lys125 130 135Val Ile Ala Val Trp Gly Thr Ser Gly Asp Met Gly Gln Thr Thr Ile140 145 150Ile Arg Met Ala Tyr Glu Asn Pro Asp Val Gln Ile Arg Phe Pro Cys155 160 165 170Arg Ala Trp Val Arg Val Met His Pro Phe Ser Pro Arg Asp Phe Val175 180 185Gln Ser Leu Val Asn Gln Leu His Ala Thr Gln Gly Val Glu Ala Leu190 195 200Leu Glu Lys Glu Lys Thr Glu Gln Asp Leu Ala Lys Lys Phe Asn Gly205 210 215Cys Val Asn Asp Arg Lys Cys Leu Ile Val Leu Asn Asp Leu Ser Thr220 225 230Ile Glu Glu Trp Asp Gln Ile Lys Lys Cys Phe Gln Lys Cys Arg Lys235 240 245 250Gly Ser Arg Ile Ile Val Ser Ser Thr Gln Val Glu Val Ala Ser Leu255 260 265Cys Ala Gly Gln Glu Ser Gln Ala Ser Glu Leu Lys Gln Leu Ser Ala270 275 280Asp Gln Thr Leu Tyr Ala Phe Tyr Asp Lys Gly Ser Gln Ile Ile Glu285 290 295Asp Ser Val Lys Pro Val Ser Ile Ser Asp Val Ala Ile Thr Ser Thr300 305 310Asn Asn His Thr Val Ala His Gly Glu Ile Ile Asp Asp Gln Ser Met315 320 325 330Asp Ala Asp Glu Lys Lys Val Ala Arg Lys Ser Leu Thr Arg Ile Arg335 340 345Thr Ser Val Gly Ala Ser Glu Glu Ser Gln Leu Ile Gly Arg Glu Lys350 355 360Glu Ile Ser Glu Ile Thr His Leu Ile Leu Asn Asn Asp Ser Gln Gln365 370 375Val Gln Val Ile Ser Val Trp Gly Met Gly Gly Leu Gly Lys Thr Thr380 385 390Leu Val Ser Gly Val Tyr Gln Ser Pro Arg Leu Ser Asp Lys Phe Asp395 400 405 410Lys Tyr Val Phe Val Thr Ile Met Arg Pro Phe Ile Leu Val Glu Leu415 420 425Leu Arg Ser Leu Ala Glu Gln Leu His Lys Gly Ser Ser Lys Lys Glu430 435 440Glu Leu Leu Glu Asn Arg Val Ser Ser Lys Lys Ser Leu Ala Ser Met445 450 455Glu Asp Thr Glu Leu Thr Gly Gln Leu Lys Arg Leu Leu Glu Lys Lys
460 465 470Ser Cys Leu Ile Val Leu Asp Asp Phe Ser Asp Thr Ser Glu Trp Asp475 480 485 490Gln Ile Lys Pro Thr Leu Phe Pro Leu Leu Glu Lys Thr Ser Arg Ile495 500 505Ile Val Thr Thr Arg Lys Glu Asn Ile Ala Asn His Cys Ser Gly Lys510 515 520Asn Gly Asn Val His Asn Leu Lys Val Leu Lys His Asn Asp Ala Leu525 530 535Cys Leu Leu Ser Glu Lys Val Phe Glu Glu Ala Thr Tyr Leu Asp Asp540 545 550Gln Asn Asn Pro Glu Leu Val Lys Glu Ala Lys Gln Ile Leu Lys Lys555 560 565 570Cys Asp Gly Leu Pro Leu Ala Ile Val Val Ile Gly Gly Phe Leu Ala575 580 585Asn Arg Pro Lys Thr Pro Glu Glu Trp Arg Lys Leu Asn Glu Asn Ile590 595 600Asn Ala Glu Leu Glu Met Asn Pro Glu Leu Gly Met Ile Arg Thr Val605 610 615Leu Glu Lys Ser Tyr Asp Gly Leu Pro Tyr His Leu Lys Ser Cys Phe620 625 630Leu Tyr Leu Ser Ile Phe Pro Glu Asp Gln Ile Ile Ser Arg Arg Arg635 640 645 650Leu Val His Arg Trp Ala Ala Glu Gly Tyr Ser Thr Ala Ala His Gly655 660 665Lys Ser Ala Ile Glu Ile Ala Asn Gly Tyr Phe Met Glu Leu Lys Asn670 675 680Arg Ser Met Ile Leu Pro Phe Gln Gln Ser Gly Ser Ser Arg Lys Ser685 690 695Ile Asp Ser Cys Lys Val His Asp Leu Met Arg Asp Ile Ala Ile Ser700 705 710Lys Ser Thr Glu Glu Asn Leu Val Phe Arg Val Glu Glu Gly Cys Ser715 720 725 730Ala Tyr Ile His Gly Ala Ile Arg His Leu Ala Ile Ser Ser Asn Trp735 740 745Lys Gly Asp Lys Ser Glu Phe Glu Gly Ile Val Asp Leu Ser Arg Ile750 755 760Arg Ser Leu Ser Leu Phe Gly Asp Trp Lys Pro Phe Phe Val Tyr Gly765 770 775Lys Met Arg Phe Ile Arg Val Leu Asp Phe Glu Gly Thr Arg Gly Leu780 785 790Glu Tyr His His Leu Asp Gln Ile Trp Lys Leu Asn His Leu Lys Phe795 800 805 810Leu Ser Leu Arg Gly Cys Tyr Arg Ile Asp Leu Leu Pro Asp Leu Leu815 820 825Gly Asn Leu Arg Gln Leu Gln Met Leu Asp Ile Arg Gly Thr Tyr Val830 835 840Lys Ala Leu Pro Lys Thr Ile Ile Lys Leu Gln Lys Leu Gln Tyr Ile845 850 855His Ala Gly Arg Lys Thr Asp Tyr Val Trp Glu Glu Lys His Ser Leu860 865 870Met Gln Arg Cys Arg Lys Val Gly Cys Ile Cys Ala Thr Cys Cys Leu875 880 885 890Pro Leu Leu Cys Glu Met Tyr Gly Pro Leu His Lys Ala Leu Ala Arg
895 900 905Arg Asp Ala Trp Thr Phe Ala Cys Cys Val Lys Phe Pro Ser Ile Met910 915 920Thr Gly Val His Glu Glu Glu Gly Ala Met Val Pro Ser Gly Ile Arg925 930 935Lys Leu Lys Asp Leu His Thr Leu Arg Asn Ile Asn Val Gly Arg Gly940 945 950Asn Ala Ile Leu Arg Asp Ile Gly Met Leu Thr Gly Leu His Lys Leu955 960 965 970Gly Val Ala Gly Ile Asn Lys Lys Asn Gly Arg Ala Phe Arg Leu Ala975 980 985Ile Ser Asn Leu Asn Lys Leu Glu Ser Leu Ser Val Ser Ser Ala Gly990 995 1000Met Pro Gly Leu Cys Gly Cys Leu Asp Asp Ile Ser Ser Pro Pro Glu100510101015Asn Leu Gln Ser Leu Lys Leu Tyr Gly Ser Leu Lys Thr Leu Pro Glu102010251030Trp Ile Lys Glu Leu Gln His Leu Val Lys Leu Lys Leu Val Ser Thr1035 104010451050Arg Leu Leu Glu His Asp Val Ala Met Glu Phe Leu Gly Glu Leu Pro105510601065Lys Val Glu Ile Leu Val Ile Ser Pro Phe Lys Ser Glu Glu Ile His107010751080Phe Lys Pro Pro Gln Thr Gly Thr Ala Phe Val Ser Leu Arg Val Leu108510901095Lys Leu Ala Gly Leu Trp Gly Ile Lys Ser Val Lys Phe Glu Glu Gly110011051110Thr Met Pro Lys Leu Glu Arg Leu Gln Val Gln Gly Arg Ile Glu Asn1115 112011251130Glu Ile Gly Phe Ser Gly Leu Glu Phe Leu Gln Asn Ile Asn Glu Val113511401145Gln Leu Ser Val Trp Phe Pro Thr Asp His Asp Arg Ile Arg Ala Ala115011551160Arg Ala Ala Gly Ala Asp Tyr Glu Thr Ala Trp Glu Glu Glu Val Gln116511701175Glu Ala Arg Arg Lys Gly Gly Glu Leu Lys Arg Lys Ile Arg Glu Gln118011851190Leu Ala Arg Asn Pro Asn Gln Pro Ile Ile Thr1195 12001205(2)SEQ ID NO2的資料(i)序列特征(A)長度3925個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA到mRNA(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置82..3696(C)鑒定方法EGCAAAATCTG CATTTGCTGA GGAGGTGGCC TTGCAGCTTG GTATCCAGAA AGACCACACA 60TTTGTTGCAG ATGAGCTTGA G ATG ATG AGG TCT TTC ATG ATG GAG GCG CAC 111Met Met Arg Ser Phe Met Met Glu Ala His1 5 10GAG GAG CAA GAT AAC AGC AAG GTG GTC AAG ACT TGG GTG AAG CAA GTC 159Glu Glu Gln Asp Asn Ser Lys Val Val Lys Thr Trp Val Lys Gln Val15 20 25CGT GAC ACT GCC TAT GAT GTT GAG GAC AGC CTC CAG GAT TTC GCT GTT 207Arg Asp Thr Ala Tyr Asp Val Glu Asp Ser Leu Gln Asp Phe Ala Val30 35 40CAT CTT AAG AGG CCA TCC TGG TGG CGA TTT CCT CGT ACG CTG CTC GAG 255His Leu Lys Arg Pro Ser Trp Trp Arg Phe Pro Arg Thr Leu Leu Glu45 50 55CGG CAC CGT GTG GCC AAG CAG ATG AAG GAG CTT AGG AAC AAG GTC GAG 303Arg His Arg Val Ala Lys Gln Met Lys Glu Leu Arg Asn Lys Val Glu60 65 70GAT GTC AGC CAG AGG AAT GTG CGG TAC CAC CTC ATC AAG GGC TCT GCC 351Asp Val Ser Gln Arg Asn Val Arg Tyr His Leu Ile Lys Gly Ser Ala75 80 85 90AAG GCC ACC ATC AAT TCC ACT GAG CAA TCT AGC GTT ATT GCT ACA GCC 399Lys Ala Thr Ile Asn Ser Thr Glu Gln Ser Ser Val Ile Ala Thr Ala95 100 105ATA TTC GGC ATT GAC GAT GCA AGG CGT GCC GCA AAG CAG GAC AAT CAG 447Ile Phe Gly Ile Asp Asp Ala Arg Arg Ala Ala Lys Gln Asp Asn Gln110 115 120AGA GTG GAT CTT GTC CAA CTA ATC AAC AGT GAG GAT CAG GAC CTA AAA 495Arg Val Asp Leu Val Gln Leu Ile Asn Ser Glu Asp Gln Asp Leu Lys125 130 135GTG ATC GCG GTC TGG GGA ACA AGT GGT GAT ATG GGC CAA ACA ACA ATA 543Val Ile Ala Val Trp Gly Thr Ser Gly Asp Met Gly Gln Thr Thr Ile140 145 150ATC AGG ATG GCT TAT GAG AAC CCA GAT GTC CAA ATC AGA TTC CCA TGC 591Ile Arg Met Ala Tyr Glu Asn Pro Asp Val Gln Ile Arg Phe Pro Cys155 160 165 170CGT GCA TGG GTA AGG GTG ATG CAT CCT TTC AGT CCA AGA GAC TTT GTC 639Arg Ala Trp Val Arg Val Met His Pro Phe Ser Pro Arg Asp Phe Val175 180 185CAG AGC TTG GTG AAT CAG CTT CAT GCA ACC CAA GGG GTT GAA GCT CTG 687Gln Ser Leu Val Asn Gln Leu His Ala Thr Gln Gly Val Glu Ala Leu190 195 200TTG GAG AAA GAG AAG ACA GAA CAA GAT TTA GCT AAG AAA TTC AAT GGA 735Leu Glu Lys Glu Lys Thr Glu Gln Asp Leu Ala Lys Lys Phe Asn Gly205 210 215TGT GTG AAT GAT AGG AAG TGT CTA ATT GTG CTT AAT GAC CTA TCC ACC 783Cys Val Asn Asp Arg Lys Cys Leu Ile Val Leu Asn Asp Leu Ser Thr220 225 230ATT GAA GAG TGG GAC CAG ATT AAG AAA TGC TTC CAA AAA TGC AGG AAA 831Ile Glu Glu Trp Asp Gln Ile Lys Lys Cys Phe Gln Lys Cys Arg Lys235 240 245 250GGA AGC CGA ATC ATA GTG TCA AGC ACT CAA GTT GAA GTT GCA AGC TTA 879Gly Ser Arg Ile Ile Val Ser Ser Thr Gln Val Glu Val Ala Ser Leu255 260 265TGT GCT GGG CAA GAA AGC CAA GCC TCA GAG CTA AAG CAA TTG TCT GCT 927Cys Ala Gly Gln Glu Ser Gln Ala Ser Glu Leu Lys Gln Leu Ser Ala270 275 280GAT CAG ACC CTT TAC GCA TTC TAC GAC AAG GGT TCC CAA ATT ATA GAG 975Asp Gln Thr Leu Tyr Ala Phe Tyr Asp Lys Gly Ser Gln Ile Ile Glu285 290 295GAT TCA GTG AAG CCA GTG TCT ATC TCG GAT GTG GCC ATC ACA AGT ACA 1023Asp Ser Val Lys Pro Val Ser Ile Ser Asp Val Ala Ile Thr Ser Thr300 305 310AAC AAT CAT ACA GTG GCC CAT GGT GAG ATT ATA GAT GAT CAA TCA ATG 1071Asn Asn His Thr Val Ala His Gly Glu Ile Ile Asp Asp Gln Ser Met315 320 325 330GAT GCT GAT GAG AAG AAG GTG GCT AGA AAG AGT CTT ACT CGC ATT AGG 1119Asp Ala Asp Glu Lys Lys Val Ala Arg Lys Ser Leu Thr Arg Ile Arg335 340 345ACA AGT GTT GGT GCT TCG GAG GAA TCA CAA CTT ATT GGG CGA GAG AAA 1167Thr Ser Val Gly Ala Ser Glu Glu Ser Gln Leu Ile Gly Arg Glu Lys350 355 360GAA ATA TCT GAA ATA ACA CAC TTA ATT TTA AAC AAT GAT AGC CAG CAG 1215Glu Ile Ser Glu Ile Thr His Leu Ile Leu Asn Asn Asp Ser Gln Gln365 370 375GTT CAG GTG ATC TCT GTG TGG GGA ATG GGT GGC CTT GGA AAA ACC ACC 1263Val Gln Val Ile Ser Val Trp Gly Met Gly Gly Leu Gly Lys Thr Thr380 385 390CTA GTA AGC GGT GTT TAT CAA AGC CCA AGG CTG AGT GAT AAG TTT GAC 1311Leu Val Ser Gly Val Tyr Gln Ser Pro Arg Leu Ser Asp Lys Phe Asp395 400 405 410AAG TAT GTT TTT GTC ACA ATC ATG CGT CCT TTC ATT CTT GTA GAG CTC 1359Lys Tyr Val Phe Val Thr Ile Met Arg Pro Phe Ile Leu Val Glu Leu415 420 425CTT AGG AGT TTG GCT GAG CAA CTA CAT AAA GGA TCT TCT AAG AAG GAA 1407Leu Arg Ser Leu Ala Glu Gln Leu His Lys Gly Ser Ser Lys Lys Glu430 435 440GAA CTG TTA GAA AAT AGA GTC AGC AGT AAG AAA TCA CTA GCA TCG ATG 1455Glu Leu Leu Glu Asn Arg Val Ser Ser Lys Lys Ser Leu Ala Ser Met445 450 455GAG GAT ACC GAG TTG ACT GGG CAG TTG AAA AGG CTT TTA GAA AAG AAA 1503Glu Asp Thr Glu Leu Thr Gly Gln Leu Lys Arg Leu Leu Glu Lys Lys460 465 470AGT TGC TTG ATT GTT CTA GAT GAT TTC TCA GAT ACC TCA GAA TGG GAC 1551Ser Cys Leu Ile Val Leu Asp Asp Phe Ser Asp Thr Ser Glu Trp Asp475 480 485 490CAG ATA AAA CCA ACG TTA TTC CCC CTG TTG GAA AAG ACA AGC CGA ATA 1599Gln Ile Lys Pro Thr Leu Phe Pro Leu Leu Glu Lys Thr Ser Arg Ile495 500 505ATT GTG ACT ACA AGA AAA GAG AAT ATT GCC AAC CAT TGC TCA GGG AAA 1647Ile Val Thr Thr Arg Lys Glu Asn Ile Ala Asn His Cys Ser Gly Lys510 515 520AAT GGA AAT GTG CAC AAC CTT AAA GTT CTT AAA CAT AAT GAT GCA TTG 1695Asn Gly Asn Val His Asn Leu Lys Val Leu Lys His Asn Asp Ala Leu525 530 535TGC CTC TTG AGT GAG AAG GTA TTT GAG GAG GCT ACA TAT TTG GAT GAT 1743Cys Leu Leu Ser Glu Lys Val Phe Glu Glu Ala Thr Tyr Leu Asp Asp540 545 550CAG AAC AAT CCA GAG TTG GTT AAA GAA GCA AAA CAA ATC CTA AAG AAG 1791Gln Asn Asn Pro Glu Leu Val Lys Glu Ala Lys Gln Ile Leu Lys Lys555 560 565 570TGC GAT GGA CTG CCC CTT GCA ATA GTT GTC ATA GGT GGA TTC TTG GCA 1839Cys Asp Gly Leu Pro Leu Ala Ile Val Val Ile Gly Gly Phe Leu Ala575 580 585AAC CGA CCA AAG ACC CCA GAA GAG TGG AGA AAA TTG AAC GAG AAT ATC 1887Asn Arg Pro Lys Thr Pro Glu Glu Trp Arg Lys Leu Asn Glu Asn Ile590 595 600AAT GCT GAG TTG GAA ATG AAT CCA GAG CTT GGA ATG ATA AGA ACC GTC 1935Asn Ala Glu Leu Glu Met Asn Pro Glu Leu Gly Met Ile Arg Thr Val605 610 615CTT GAA AAA AGC TAT GAT GGT TTA CCA TAC CAT CTC AAG TCA TGT TTT 1983Leu Glu Lys Ser Tyr Asp Gly Leu Pro Tyr His Leu Lys Ser Cys Phe620 625 630TTA TAT CTG TCC ATT TTC CCT GAA GAC CAG ATC ATT AGT CGA AGG CGT 2031Leu Tyr Leu Ser Ile Phe Pro Glu Asp Gln Ile Ile Ser Arg Arg Arg635 640 645 650TTG GTG CAT CGT TGG GCA GCA GAA GGT TAC TCA ACT GCA GCA CAT GGG 2079Leu Val His Arg Trp Ala Ala Glu Gly Tyr Ser Thr Ala Ala His Gly655 660 665AAA TCT GCC ATT GAA ATA GCT AAC GGC TAC TTC ATG GAA CTC AAG AAT 2127Lys Ser Ala Ile Glu Ile Ala Asn Gly Tyr Phe Met Glu Leu Lys Asn670 675 680AGA AGC ATG ATT TTA CCA TTC CAG CAA TCA GGT AGC AGC AGG AAA TCA 2175Arg Ser Met Ile Leu Pro Phe Gln Gln Ser Gly Ser Ser Arg Lys Ser685 690 695ATT GAC TCT TGC AAA GTC CAT GAT CTC ATG CGT GAC ATC GCC ATC TCA 2223Ile Asp Ser Cys Lys Val His Asp Leu Met Arg Asp Ile Ala Ile Ser700 705 710AAG TCA ACG GAG GAA AAC CTT GTT TTT AGG GTG GAG GAA GGC TGC AGC 2271Lys Ser Thr Glu Glu Asn Leu Val Phe Arg Val Glu Glu Gly Cys Ser715 720 725 730GCG TAC ATA CAT GGT GCA ATT CGT CAT CTT GCT ATA AGT AGC AAC TGG 2319Ala Tyr Ile His Gly Ala Ile Arg His Leu Ala Ile Ser Ser Asn Trp735 740 745AAG GGA GAT AAG AGT GAA TTC GAG GGC ATA GTG GAC CTG TCC CGA ATA 2367Lys Gly Asp Lys Ser Glu Phe Glu Gly Ile Val Asp Leu Ser Arg Ile750 755 760CGA TCG TTA TCT CTG TTT GGG GAT TGG AAG CCA TTT TTT GTT TAT GGC 2415Arg Ser Leu Ser Leu Phe Gly Asp Trp Lys Pro Phe Phe Val Tyr Gly765 770 775AAG ATG AGG TTT ATA CGA GTG CTT GAC TTT GAA GGG ACT AGA GGT CTA 2463Lys Met Arg Phe Ile Arg Val Leu Asp Phe Glu Gly Thr Arg Gly Leu780 785 790GAA TAT CAT CAC CTT GAT CAG ATT TGG AAG CTT AAT CAC CTA AAA TTC 2511Glu Tyr His His Leu Asp Gln Ile Trp Lys Leu Asn His Leu Lys Phe795 800 805 810CTT TCT CTA CGA GGA TGC TAT CGT ATT GAT CTA CTG CCA GAT TTA CTG 2559Leu Ser Leu Arg Gly Cys Tyr Arg Ile Asp Leu Leu Pro Asp Leu Leu815 820 825GGC AAC CTG AGG CAA CTC CAG ATG CTA GAC ATC AGA GGT ACA TAT GTA 2607Gly Asn Leu Arg Gln Leu Gln Met Leu Asp Ile Arg Gly Thr Tyr Val830 835 840AAG GCT TTG CCA AAA ACC ATC ATC AAG CTT CAG AAG CTA CAG TAC ATT 2655Lys Ala Leu Pro Lys Thr Ile Ile Lys Leu Gln Lys Leu Gln Tyr Ile845 850 855CAT GCT GGG CGC AAA ACA GAC TAT GTA TGG GAG GAA AAG CAT AGT TTA 2703His Ala Gly Arg Lys Thr Asp Tyr Val Trp Glu Glu Lys His Ser Leu860 865 870ATG CAG AGG TGT CGT AAG GTG GGA TGT ATA TGT GCA ACA TGT TGC CTC 2751Met Gln Arg Cys Arg Lys Val Gly Cys Ile Cys Ala Thr Cys Cys Leu875 880 885 890CCT CTT CTT TGC GAA ATG TAT GGC CCT CTC CAT AAG GCC CTA GCC CGG 2799Pro Leu Leu Cys Glu Met Tyr Gly Pro Leu His Lys Ala Leu Ala Arg895 900 905CGT GAT GCG TGG ACT TTC GCT TGC TGC GTG AAA TTC CCA TCT ATC ATG 2847Arg Asp Ala Trp Thr Phe Ala Cys Cys Val Lys Phe Pro Ser Ile Met910 915 920ACG GGA GTA CAT GAA GAG GAA GGC GCT ATG GTG CCA AGT GGG ATT AGA 2895Thr Gly Val His Glu Glu Glu Gly Ala Met Val Pro Ser Gly Ile Arg925 930 935AAA CTG AAA GAC TTG CAC ACA CTA AGG AAC ATA AAT GTC GGA AGG GGA 2943Lys Leu Lys Asp Leu His Thr Leu Arg Asn Ile Asn Val Gly Arg Gly940 945 950AAT GCC ATC CTA CGA GAT ATC GGA ATG CTC ACA GGA TTA CAC AAG TTA 2991Asn Ala Ile Leu Arg Asp Ile Gly Met Leu Thr Gly Leu His Lys Leu955 960 965 970GGA GTG GCT GGC ATC AAC AAG AAG AAT GGA CGA GCG TTT CGC TTG GCC 3039Gly Val Ala Gly Ile Asn Lys Lys Asn Gly Arg Ala Phe Arg Leu Ala975 980 985ATT TCC AAC CTC AAC AAG CTG GAA TCA CTG TCT GTG AGT TCA GCA GGG 3087Ile Ser Asn Leu Asn Lys Leu Glu Ser Leu Ser Val Ser Ser Ala Gly990 995 1000ATG CCG GGC TTG TGT GGT TGC TTG GAT GAT ATA TCC TCG CCT CCG GAA 3135Met Pro Gly Leu Cys Gly Cys Leu Asp Asp Ile Ser Ser Pro Pro Glu100510101015AAC CTA CAG AGC CTC AAG CTG TAC GGC AGT TTG AAA ACG TTG CCG GAA 3183Asn Leu Gln Ser Leu Lys Leu Tyr Gly Ser Leu Lys Thr Leu Pro Glu102010251030TGG ATC AAG GAG CTC CAG CAT CTC GTG AAG TTA AAA CTA GTG AGT ACT 3231Trp Ile Lys Glu Leu Gln His Leu Val Lys Leu Lys Leu Val Ser Thr1035 104010451050AGG CTA TTG GAG CAC GAC GTT GCT ATG GAA TTC CTT GGG GAA CTA CCG 3279Arg Leu Leu Glu His Asp Val Ala Met Glu Phe Leu Gly Glu Leu Pro105510601065AAG GTG GAA ATT CTA GTT ATT TCA CCG TTT AAG AGT GAA GAA ATT CAT 3327Lys Val Glu Ile Leu Val Ile Ser Pro Phe Lys Ser Glu Glu Ile His107010751080TTC AAG CCT CCG CAG ACT GGG ACT GCT TTT GTA AGC CTC AGG GTG CTC 3375Phe Lys Pro Pro Gln Thr Gly Thr Ala Phe Val Ser Leu Arg Val Leu108510901095AAG CTT GCA GGA TTA TGG GGC ATC AAA TCA GTG AAG TTT GAG GAA GGA 3423Lys Leu Ala Gly Leu Trp Gly Ile Lys Ser Val Lys Phe Glu Glu Gly110011051110ACA ATG CCC AAA CTT GAG AGG CTG CAG GTC CAA GGG CGA ATA GAA AAT 3471Thr Met Pro Lys Leu Glu Arg Leu Gln Val Gln Gly Arg Ile Glu Asn1115 112011251130GAA ATT GGC TTT TCT GGG TTA GAG TTT CTC CAA AAC ATC AAC GAA GTC 3519Glu Ile Gly Phe Ser Gly Leu Glu Phe Leu Gln Asn Ile Asn Glu Val113511401145CAG CTC AGT GTT TGG TTT CCC ACG GAT CAT GAT AGG ATA AGA GCC GCG 3567Gln Leu Ser Val Trp Phe Pro Thr Asp His Asp Arg Ile Arg Ala Ala115011551160CGC GCC GCG GGC GCT GAT TAT GAG ACT GCC TGG GAG GAA GAG GTA CAG3615Arg Ala Ala Gly Ala Asp Tyr Glu Thr Ala Trp Glu Glu Glu Val Gln116511701175GAA GCA AGG CGC AAG GGA GGT GAA CTG AAG AGG AAA ATC CGA GAA CAG3663Glu Ala Arg Arg Lys Gly Gly Glu Leu Lys Arg Lys Ile Arg Glu Gln118011851190CTT GCT CGG AAT CCA AAC CAA CCC ATC ATT ACC TGAGCTCCTT TGGAGTTACT 3716Leu Ala Arg Asn Pro Asn Gln Pro Ile Ile Thr1195 12001205TTGCCGTGCT CCATACTATC CTACAAGTGA GATCCTCTGC AGTACTGCATGCTCACTGAC 3776ATGTGGACCC GAGGGGCTGT GGGGCCCACA TGTCAGTGAG CAGTACTGTGCAGTACTGCA 3836GAGGACCTGC ATCCACTATC CTATATTATA ATGGATTGTA CTATCGATCCAACTATTCAG 3896ATTAACTCTA TACTAGTGAA CTTATTTTT3925(2)SEQ ID NO3的資料(i)序列特征(A)長度10322個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型基因組DNA(ix)特征(A)名稱/關(guān)鍵詞外顯子(B)位置3630..4586(C)鑒定方法E(ix)特征(A)名稱/關(guān)鍵詞外顯子(B)位置5927..6682(C)鑒定方法E(ix)特征(A)名稱/關(guān)鍵詞外顯子(B)位置6991..8973(C)鑒定方法E(xi)序列描述SEQ ID NO3CGGCCGCATA ATACGACTCA CTATAGGGAT CTCCTCTAGA GTTACTTTGC CGTGCTCCAT 60ACTATCCTAT TCTATATTGG ATTATACTAT CGATCCAACG ATTCAGATTA ACTCTATACT 120AGTGAAGTCT ACACTTATGG TATGGGTAAT ATACATATGT AGTATAGTAT AGCATAAGGG 180TATTTCATTT TGCAGGTTAG CCGTTTATCT GCTGGTGCTC CTCTTGCTGT AGTAGTGTTG 240TTGGTGTTGC TGCTGATGAC CTAAAATGCT TGCATGTTTC TATCATGTTC TCCATAATGT 300AGTATCATGT ACTCCATCTT CCTTGTTGGT TTTTGTCCAT AATCTCCACC TTGGCAGCTT 360GCATCATCTT ACTCTCGAGC TTGTCCACCT TGAGATTCAA CTCCTGGAAC GCGGCTCCCA 420GTTCATCCAC CCTCTTCTCC ACGGCAGGAA TCCGTGACTC CACCGTACGC TTGAGATCTT 480GGTACTCCGC CCTGGTGCGC TCATCAGCCT CAACTCGTTT CTTCTCATTC CCTTCCACAA 540GTTGCAGAAG GAGGTCCAAC TTCTTATCAG TCTCCATGGC CTCGGATCTG GATCAGGTAC 600CTACTGCTCT CGCTCCGAAT TCCGCGAACC TTAGGGGGCA AGTTTCCTTT TCGCGGTGCC 660GATCCGAAGA TCAGCTCCAA TCCACCCCAA GGAACAATTT CACCGCAGAA TCAAGAGAAT 720TTGAGAAGCA AGAGAGGCTC TGATACCAGA TTGTCAGGAT CTCAAGAAAT CAGCAAAGAA 780CAACAAGAAC ACACAAGGAT TCAGGCAACT AGTTTGGATT GATCTGCTCC AACCCAACAG 840GATTGAGCCT TCCGCCGCCA CCGCCACCGA GTTGCCAGTT CATAGTTGTC TTTCTCGAGT 900TCATCTTATT TATACAGTAG TATCTCCCTA CTCACACGAC ACACACAGTA GCCAGCTGTA 960CAACAGATAG CTGGGCTACG CAACCCACTC GGACCCATGG TAACGAGGAT TGGGCTTTGG 1020CCCTCTTGTG GGTCTTGCTC TTCCTGGAGT AGTAGTCTGT ATCTCCTCCT CCTGGACTTC 1080AGCTTCTGCT TCATCAGGTT CTCCTTCTTC AGGTTCCTTC TCTCCCTGTT CAGCTTCTGC 1140TTCATCAGGT TCTCCTTCTT CAGTACCCAT AGTGACAGGC AGGTTCCTGA CAAAATTCTG 1200CTCGTTTGCG ACCAATGGTA GTGATCATAG TTGCAACCAG GAGGGGGGGG GGGGAAATCG 1260CCGTCCCCTC CGCTCCTCTC CCGTCGTCCC CAACGCCTCG TTCGCGCATT TCGTTGAACA 1320CCATGACGGC GCCGAATTCG CAGTGTCCGC ACATCTCCTC CTCCCCCGTC CTCTCCAAAC 1380CCCAAACCCT ATCTCCACCC CCGAGGCAGG CGCCCCCATG CACTTGTAAG TCGATTGGAT 1440GTCCTGTCCC AGAAGACATA TCGAGCGAGG AGGCGGAGGG GGACGAAGGG AACATATCGA 1500GCGAGGAAGC GGAGGGTGGA TCGGCATCCC CCATTTCAAG GTACTATACT AGTCCATTAT 1560AGTAGTAGTG CTTTTGCATC TTAGAAAAAA AAATATGTTC ATTAGCCATT GAGAGCTTCT 1620GAAGTTGTTG ATTTTGTTCC AACCCCAACT GTGAGTTTCA GTTCAGGTCA TCCACTGATT 1680TTCACTATGC CAATTCTCTG AAACAACTTT ACCACTGTCA CATGAACACA CTGAAACAGT 1740TTGGTGTAGA CGTGTAGTGA AGAATGTAGC ATATATACCT TCACTTAATT TTTCTTGCAA 1800TTATTGGCCA TTACTAGTTA TGCGAGGTAG AAGTGTTCTA AGGTACTGTA TCATTTTTAT 1860GTACTAATTA ATTAAGTTTA ATAAAAACTT TTATTATCTA AAAATAAATG ACTATTACTA 1920GCTCGGTACT CCCTTTATTT TATATTATAA GACGTTTTGA TTTTTTTATA TACAACTTTC 1980TTTAAGTTTG ATTATACTTA TAAAAAATTA GCAAACATAT ATATTTTTTT TACATTAATA 2040GTGCAAGTGA GCACGCTTAA ATGCATTGTA CTTCCTTCGT AAAAAAACAT CAAACTTTTA 2100CGGACGAATA TGGATAAATG CATATCTAAA TTCATCCTCA ATAATTGATT CTTTTTGGAG 2160GAGTACAATT GGTTGGTGCG CTTTGTCCTT GGACCCTACA ATAATGATGA TTGTTTCTTT 2220AATCTATTGA CCTTGACTTA CCACATGGGC TATGTTTATC CCTTCCTGAA TCCTGAGCAC 2280TGACTACCGA GGCACCGAGT GTGAGCGGCA ACGGCGGTCA GGGAGCAGGC GTGGCTCGTC 2340GGCGAGCGGC TACGGGCAAC GGCGCCTTGG CGTCAGGCAT CCGCCGTCAC TCACCTCAAG 2400CTTGCGGGCT CTGCGACCAC CCTCTCATAG TCATAGGCCA CAGAAGGTGT AGTAGTACTT 2460CATACATTTC GAGCAGTTTC TTTCAGATTG TTTGTTTTTG AGCTTCTAAT TTTGGGATGC 2520ATTAGATAGT GATGAAAGCC TGAATTATTG GAATTTTGGT GTTGGTACTC ACACTCTCAC 2580AGTCAGAACA TACTCCTATA TATTTTGCAG CACATTTGCC TTGTGCGTGC TGTTCGTCTG 2640TTCCACTCGT GAACATCAGA CGCGAAGATT ATAGATTCAC CCCTGTTCAC AGATTCAGGT 2700ACTGCCAATT GCCTGGATGA ACACCAGTCC ATTTGCTCTC TTTCGCCTTA CAATTTTTCT 2760CTGCATTGTA CTAGCAGCCG TAGCTCGAAA GCCTCGAATA TGATTCCTTT TCAAGATTTT 2820ATATTTATGG AATATAATTC ACTTTTAAGA TGCCTTGATG GTGAAATAGT AGACATGTGA 2880GACTCCAAAT CTCGTCCTAA AAGAGCATGG AGGTAAAAAA AGAAAAAGGT AGACATCGCT 2940ATTGTAGACA TGGAGAGCTG GAATACGATT ACTTTCAAGA TATTATATTC AATGAGCATT 3000CATTCTTACA CATATGCCAC AAAGGTAAAA AAAAACAGAG AAAGAGAGAG AGAGGGGAAA 3060GAAGCCAAGT TCTTTCTTCT ACTATCATTT AGGTTGAGTT CGTTTGTTAA GGTTCCCAAC 3120CTACGATTCC TCGTTTCCCG CGTGCACGAT TCCCAAACTA CTAAATGGTA TGCTTTTTAA 3180AATATTTCGT AGAAAAATTG CTTTAAAAAA TCATATTAAT TTATTTTTTA AGTTGTTTAG 3240CTAATACTCA ATTAATCATG CATTAATTTG CCGCTCCGTT TTAGTGGAAG TCATCTGAAA 3300GGATCAAAGG AAGCAACACC AAGTCCTTAT TTCGACTCCG ACTCTCTCAC TCTCGCCATT 3360TATTCTTTTC TTTCTGTTAT TTTAAAAGTT GCTACTTTAG CTTCAGCCAC GTGAATTCTT 3420GATATTTCAT TATTTTTCTC ATCAAACAAT AGCATCTTCT TCTGGAAATC GAATTCAGGG 3480CTTATATGTT GCTTATTCTG ATATATAGGT CTGTCACGAG GCGTATGATC ATCAACTCTG 3540CCACAAAATC CATTCAAAAA TAGAACAGAG CAATGGAGGC GACGGCGCTG AGTGTGGGCA 3600AATCCGTGCT GAATGGAGCG CTTGGCTACG CAAAATCTGC ATTTGCTGAG GAGGTGGCCT 3660TGCAGCTTGG TATCCAGAAA GACCACACAT TTGTTGCAGA TGAGCTTGAG ATG ATG3716Met Met1AGG TCT TTC ATG ATG GAG GCG CAC GAG GAG CAA GAT AAC AGC AAG GTG 3764Arg Ser Phe Met Met Glu Ala His Glu Glu Gln Asp Asn Ser Lys Val5 10 15GTC AAG ACT TGG GTG AAG CAA GTC CGT GAC ACT GCC TAT GAT GTT GAG3812Val Lys Thr Trp Val Lys Gln Val Arg Asp Thr Ala Tyr Asp Val Glu20 25 30GAC AGC CTC CAG GAT TTC GCT GTT CAT CTT AAG AGG CCA TCC TGG TGG3860Asp Ser Leu Gln Asp Phe Ala Val His Leu Lys Arg Pro Ser Trp Trp35 40 45 50CGA TTT CCT CGT ACG CTG CTC GAG CGG CAC CGT GTG GCC AAG CAG ATG3908Arg Phe Pro Arg Thr Leu Leu Glu Arg His Arg Val Ala Lys Gln Met55 60 65AAG GAG CTT AGG AAC AAG GTC GAG GAT GTC AGC CAG AGG AAT GTG CGG3956Lys Glu Leu Arg Asn Lys Val Glu Asp Val Ser Gln Arg Asn Val Arg70 75 80TAC CAC CTC ATC AAG GGC TCT GCC AAG GCC ACC ATC AAT TCC ACT GAG4004Tyr His Leu Ile Lys Gly Ser Ala Lys Ala Thr Ile Asn Ser Thr Glu85 90 95CAA TCT AGC GTT ATT GCT ACA GCC ATA TTC GGC ATT GAC GAT GCA AGG4052Gln Ser Ser Val Ile Ala Thr Ala Ile Phe Gly Ile Asp Asp Ala Arg100 105 110CGT GCC GCA AAG CAG GAC AAT CAG AGA GTG GAT CTT GTC CAA CTA ATC4100Arg Ala Ala Lys Gln Asp Asn Gln Arg Val Asp Leu Val Gln Leu Ile115 120 125 130AAC AGT GAG GAT CAG GAC CTA AAA GTG ATC GCG GTC TGG GGA ACA AGT4148Asn Ser Glu Asp Gln Asp Leu Lys Val Ile Ala Val Trp Gly Thr Ser135 140 145GGT GAT ATG GGC CAA ACA ACA ATA ATC AGG ATG GCT TAT GAG AAC CCA4196Gly Asp Met Gly Gln Thr Thr Ile Ile Arg Met Ala Tyr Glu Asn Pro150 155 160GAT GTC CAA ATC AGA TTC CCA TGC CGT GCA TGG GTA AGG GTG ATG CAT4244Asp Val Gln Ile Arg Phe Pro Cys Arg Ala Trp Val Arg Val Met His165 170 175CCT TTC AGT CCA AGA GAC TTT GTC CAG AGC TTG GTG AAT CAG CTT CAT 4292Pro Phe Ser Pro Arg Asp Phe Val Gln Ser Leu Val Asn Gln Leu His180 185 190GCA ACC CAA GGG GTT GAA GCT CTG TTG GAG AAA GAG AAG ACA GAA CAA 4340Ala Thr Gln Gly Val Glu Ala Leu Leu Glu Lys Glu Lys Thr Glu Gln195 200 205 210GAT TTA GCT AAG AAA TTC AAT GGA TGT GTG AAT GAT AGG AAG TGT CTA 4388Asp Leu Ala Lys Lys Phe Asn Gly Cys Val Asn Asp Arg Lys Cys Leu215 220 225ATT GTG CTT AAT GAC CTA TCC ACC ATT GAA GAG TGG GAC CAG ATT AAG 4436Ile Val Leu Asn Asp Leu Ser Thr Ile Glu Glu Trp Asp Gln Ile Lys230 235 240AAA TGC TTC CAA AAA TGC AGG AAA GGA AGC CGA ATC ATA GTG TCA AGC 4484Lys Cys Phe Gln Lys Cys Arg Lys Gly Ser Arg Ile Ile Val Ser Ser245 250 255ACT CAA GTT GAA GTT GCA AGC TTA TGT GCT GGG CAA GAA AGC CAA GCC 4532Thr Gln Val Glu Val Ala Ser Leu Cys Ala Gly Gln Glu Ser Gln Ala260 265 270TCA GAG CTA AAG CAA TTG TCT GCT GAT CAG ACC CTT TAC GCA TTC TAC 4580Ser Glu Leu Lys Gln Leu Ser Ala Asp Gln Thr Leu Tyr Ala Phe Tyr275 280 285 290GAC AAG GTAATATACT TGCTCTTCAA GCATACCTCT CGATATCATT TTTAATTCAG 4636Asp LysTTATGCCTTT AGTAATTTCT AATTCAATTG TGTATAGGCT AGTTGAAGTG CGTGGGAGTT 4696ACCATTCCAT TAGAAACACA TGACCTAATG CAACTAACAA GTGCTCCTCC TGTTCTCTCT 4756CATTTGCCTT TTGGGAATGC ATGCACTCAA CATTTTAAGA TTACAGCCAA AATATATGTA 4816TTTGGATTTG TCAAAACAAA GATGTATGCT AGAAAAAGAA ATGGTCTAAT ACAGGTTTAC 4876AAATAAGACA ACGATGCAAA AAGGGCAACT AAAAACATAT TGATTCCCTC ATCTGCCACT 4936GCAATTGCCT TAAATTCTAG TCCATTCTAC TATCTCCGTT TCATATTATA AGTCACTCTA 4996GTTTTTTTCC AGTCAAACTT CTTTAGTTTG ACCAAGTTTA TACAAAAATT TAGCAACATA 5056TCCAACACGA AATTAGTTTC ATTAAATGTA GCATTGAATA TATTTTGATA GTATGTTTGT 5116TTTGTGTTGA AAATGCTGCT ATATTTTTTA AAAAAACTTG GTCAAACCTA AACAAGTTTG 5176ACTAGGAGAA AAGTCGAAAC GACTTATAAT ATGAAATAGA GGGAGAATGT TCGAAGTTTG 5236GCTAACGGTC AATGCTAGTG CTTTAAGTGG GTAAGCCGCA AATCCAATTA TAGGCCAAAA 5296TACATGGGTT TGTGGCTTAT TTTGGCTATA AGTGGGTTTC GCGGGTTAGC CACTTACACC 5356CCTAGTCAAT GCTAATGAAA GTAGAAGTGA TGCTATTCAA GGAAAATGTA TTGGATACCG 5416AGATTGCCTT GAATAAAGAA TAAAATTGAG GTAGTAGATT GGATAATAGA TTGACCCACA 5476AAATTGTACA AGTATGTAAT GTAGCACAAG TCCTCTTTGC ACAATTAAAA TTTTGAAGCT 5536CCTATTTCAC AAATAATTTT GATATGGATT AATTGATTTC ATATCCAATT CGCACAGTTT 5596ATTGAATTTG GAGATTTATT TCCTCTATAT GTGAGAGATG ATTGTAAAAT GGGCAAATCT 5656AGCAAATGCA TCCTCTCATC CTTTGGATTA AATGTAGTGT ACTTATCCCA TTATTTTAAA 5716GTTAAATTAA TACATATTTT ATTGAACAGT CAGATATACG TTTTTCAAAA TAGGATCCAA 5776AACTAAGGTT TATACTAGAC TGCAAATTAA TGAAAGGAAT TATCATTATT GTTTTGTATA 5836CTTTCATGAC CGAAAACAAG GCTAAACACT ATCCATGTAT GAAAATTTAA GGCTAAAAGT 5896TGTTCTTAAT CATTGCTCCC TTTTGTTTAG GGT TCC CAA ATT ATA GAG GAT TCA5950Gly Ser Gln Ile Ile Glu Asp Ser295 300GTG AAG CCA GTG TCT ATC TCG GAT GTG GCC ATC ACA AGT ACA AAC AAT 5998Val Lys Pro Val Ser Ile Ser Asp Val Ala Ile Thr Ser Thr Asn Asn305 310 315CAT ACA GTG GCC CAT GGT GAG ATT ATA GAT GAT CAA TCA ATG GAT GCT 6046His Thr Val Ala His Gly Glu Ile Ile Asp Asp Gln Ser Met Asp Ala320 325 330GAT GAG AAG AAG GTG GCT AGA AAG AGT CTT ACT CGC ATT AGG ACA AGT 6094Asp Glu Lys Lys Val Ala Arg Lys Ser Leu Thr Arg Ile Arg Thr Ser335 340 345GTT GGT GCT TCG GAG GAA TCA CAA CTT ATT GGG CGA GAG AAA GAA ATA 6142Val Gly Ala Ser Glu Glu Ser Gln Leu Ile Gly Arg Glu Lys Glu Ile350 355 360TCT GAA ATA ACA CAC TTA ATT TTA AAC AAT GAT AGC CAG CAG GTT CAG 6190Ser Glu Ile Thr His Leu Ile Leu Asn Asn Asp Ser Gln Gln Val Gln365 370 375 380GTG ATC TCT GTG TGG GGA ATG GGT GGC CTT GGA AAA ACC ACC CTA GTA 6238Val Ile Ser Val Trp Gly Met Gly Gly Leu Gly Lys Thr Thr Leu Val385 390 395AGC GGT GTT TAT CAA AGC CCA AGG CTG AGT GAT AAG TTT GAC AAG TAT 6286Ser Gly Val Tyr Gln Ser Pro Arg Leu Ser Asp Lys Phe Asp Lys Tyr400 405 410GTT TTT GTC ACA ATC ATG CGT CCT TTC ATT CTT GTA GAG CTC CTT AGG 6334Val Phe Val Thr Ile Met Arg Pro Phe Ile Leu Val Glu Leu Leu Arg415 420 425AGT TTG GCT GAG CAA CTA CAT AAA GGA TCT TCT AAG AAG GAA GAA CTG 6382Ser Leu Ala Glu Gln Leu His Lys Gly Ser Ser Lys Lys Glu Glu Leu430 435 440TTA GAA AAT AGA GTC AGC AGT AAG AAA TCA CTA GCA TCG ATG GAG GAT 6430Leu Glu Asn Arg Val Ser Ser Lys Lys Ser Leu Ala Ser Met Glu Asp445 450 455 460ACC GAG TTG ACT GGG CAG TTG AAA AGG CTT TTA GAA AAG AAA AGT TGC 6478Thr Glu Leu Thr Gly Gln Leu Lys Arg Leu Leu Glu Lys Lys Ser Cys465 470 475TTG ATT GTT CTA GAT GAT TTC TCA GAT ACC TCA GAA TGG GAC CAG ATA 6526Leu Ile Val Leu Asp Asp Phe Ser Asp Thr Ser Glu Trp Asp Gln Ile480 485 490AAA CCA ACG TTA TTC CCC CTG TTG GAA AAG ACA AGC CGA ATA ATT GTG 6574Lys Pro Thr Leu Phe Pro Leu Leu Glu Lys Thr Ser Arg Ile Ile Val495 500 505ACT ACA AGA AAA GAG AAT ATT GCC AAC CAT TGC TCA GGG AAA AAT GGA 6622Thr Thr Arg Lys Glu Asn Ile Ala Asn His Cys Ser Gly Lys Asn Gly510 515 520AAT GTG CAC AAC CTT AAA GTT CTT AAA CAT AAT GAT GCA TTG TGC CTC 6670Asn Val His Asn Leu Lys Val Leu Lys His Asn Asp Ala Leu Cys Leu525 530 535 540TTG AGT GAG AAG GTAATATAAG TGTGCTCCAT TTTTCTTGGT TTGATATTCT 6722Leu Ser Glu LysTTTAATCATT TGAGTTATCC AATCAAGATG ATATTTGTGC ATGCAGAAAT AGCATATACT 6782AGATTCATAT ACAACTTAAT CTGTTCTCAC AACAATAGCA ATGCAGTTCC TAAAATGACC 6842TGCATTGGAT GGACGTTAGA TGTGACTTTG TTTTTGTATG TAATGGTGGC CTTCATTCCT 6902TAGTTTTAAT AGTAAAGACG TATTTCTAAA TTTAATTTTT TTTGTTTTAC TTTAGAGCAC 6962AATAAAGCTT AAATTGTATC AATGTCAG GTA TTT GAG GAG GCT ACA TAT TTG 7014Val Phe Glu Glu Ala Thr Tyr Leu545 550GAT GAT CAG AAC AAT CCA GAG TTG GTT AAA GAA GCA AAA CAA ATC CTA 7062Asp Asp Gln Asn Asn Pro Glu Leu Val Lys Glu Ala Lys Gln Ile Leu555 560 565AAG AAG TGC GAT GGA CTG CCC CTT GCA ATA GTT GTC ATA GGT GGA TTC 7110Lys Lys Cys Asp Gly Leu Pro Leu Ala Ile Val Val Ile Gly Gly Phe570 575 580TTG GCA AAC CGA CCA AAG ACC CCA GAA GAG TGG AGA AAA TTG AAC GAG 7158Leu Ala Asn Arg Pro Lys Thr Pro Glu Glu Trp Arg Lys Leu Asn Glu585 590 595 600AAT ATC AAT GCT GAG TTG GAA ATG AAT CCA GAG CTT GGA ATG ATA AGA 7206Asn Ile Asn Ala Glu Leu Glu Met Asn Pro Glu Leu Gly Met Ile Arg605 610 615ACC GTC CTT GAA AAA AGC TAT GAT GGT TTA CCA TAC CAT CTC AAG TCA 7254Thr Val Leu Glu Lys Ser Tyr Asp Gly Leu Pro Tyr His Leu Lys Ser620 625 630TGT TTT TTA TAT CTG TCC ATT TTC CCT GAA GAC CAG ATC ATT AGT CGA 7302Cys Phe Leu Tyr Leu Ser Ile Phe Pro Glu Asp Gln Ile Ile Ser Arg635 640 645AGG CGT TTG GTG CAT CGT TGG GCA GCA GAA GGT TAC TCA ACT GCA GCA 7350Arg Arg Leu Val His Arg Trp Ala Ala Glu Gly Tyr Ser Thr Ala Ala650 655 660CAT GGG AAA TCT GCC ATT GAA ATA GCT AAC GGC TAC TTC ATG GAA CTC 7398His Gly Lys Ser Ala Ile Glu Ile Ala Asn Gly Tyr Phe Met Glu Leu665 670 675 680AAG AAT AGA AGC ATG ATT TTA CCA TTC CAG CAA TCA GGT AGC AGC AGG 7446Lys Asn Arg Ser Met Ile Leu Pro Phe Gln Gln Ser Gly Ser Ser Arg685 690 695AAA TCA ATT GAC TCT TGC AAA GTC CAT GAT CTC ATG CGT GAC ATC GCC 7494Lys Ser Ile Asp Ser Cys Lys Val His Asp Leu Met Arg Asp Ile Ala700 705 710ATC TCA AAG TCA ACG GAG GAA AAC CTT GTT TTT AGG GTG GAG GAA GGC 7542Ile Ser Lys Ser Thr Glu Glu Asn Leu Val Phe Arg Val Glu Glu Gly715 720 725TGC AGC GCG TAC ATA CAT GGT GCA ATT CGT CAT CTT GCT ATA AGT AGC 7590Cys Ser Ala Tyr Ile His Gly Ala Ile Arg His Leu Ala Ile Ser Ser730 735 740AAC TGG AAG GGA GAT AAG AGT GAA TTC GAG GGC ATA GTG GAC CTG TCC 7638Asn Trp Lys Gly Asp Lys Ser Glu Phe Glu Gly Ile Val Asp Leu Ser745 750 755 760CGA ATA CGA TCG TTA TCT CTG TTT GGG GAT TGG AAG CCA TTT TTT GTT 7686Arg Ile Arg Ser Leu Ser Leu Phe Gly Asp Trp Lys Pro Phe Phe Val765 770 775TAT GGC AAG ATG AGG TTT ATA CGA GTG CTT GAC TTT GAA GGG ACT AGA 7734Tyr Gly Lys Met Arg Phe Ile Arg Val Leu Asp Phe Glu Gly Thr Arg780 785 790GGT CTA GAA TAT CAT CAC CTT GAT CAG ATT TGG AAG CTT AAT CAC CTA 7782Gly Leu Glu Tyr His His Leu Asp Gln Ile Trp Lys Leu Asn His Leu795 800 805AAA TTC CTT TCT CTA CGA GGA TGC TAT CGT ATT GAT CTA CTG CCA GAT 7830Lys Phe Leu Ser Leu Arg Gly Cys Tyr Arg Ile Asp Leu Leu Pro Asp810 815 820TTA CTG GGC AAC CTG AGG CAA CTC CAG ATG CTA GAC ATC AGA GGT ACA 7878Leu Leu Gly Asn Leu Arg Gln Leu Gln Met Leu Asp Ile Arg Gly Thr825 830 835 840TAT GTA AAG GCT TTG CCA AAA ACC ATC ATC AAG CTT CAG AAG CTA CAG 7926Tyr Val Lys Ala Leu Pro Lys Thr Ile Ile Lys Leu Gln Lys Leu Gln845 850 855TAC ATT CAT GCT GGG CGC AAA ACA GAC TAT GTA TGG GAG GAA AAG CAT 7974Tyr Ile His Ala Gly Arg Lys Thr Asp Tyr Val Trp Glu Glu Lys His860 865 870AGT TTA ATG CAG AGG TGT CGT AAG GTG GGA TGT ATA TGT GCA ACA TGT 8022Ser Leu Met Gln Arg Cys Arg Lys Val Gly Cys Ile Cys Ala Thr Cys875 880 885TGC CTC CCT CTT CTT TGC GAA ATG TAT GGC CCT CTC CAT AAG GCC CTA 8070Cys Leu Pro Leu Leu Cys Glu Met Tyr Gly Pro Leu His Lys Ala Leu890 895 900GCC CGG CGT GAT GCG TGG ACT TTC GCT TGC TGC GTG AAA TTC CCA TCT 8118Ala Arg Arg Asp Ala Trp Thr Phe Ala Cys Cys Val Lys Phe Pro Ser905 910 915 920ATC ATG ACG GGA GTA CAT GAA GAG GAA GGC GCT ATG GTG CCA AGT GGG 8166Ile Met Thr Gly Val His Glu Glu Glu Gly Ala Met Val Pro Ser Gly925 930 935ATT AGA AAA CTG AAA GAC TTG CAC ACA CTA AGG AAC ATA AAT GTC GGA 8214Ile Arg Lys Leu Lys Asp Leu His Thr Leu Arg Asn Ile Asn Val Gly940 945 950AGG GGA AAT GCC ATC CTA CGA GAT ATC GGA ATG CTC ACA GGA TTA CAC 8262Arg Gly Asn Ala Ile Leu Arg Asp Ile Gly Met Leu Thr Gly Leu His955 960 965AAG TTA GGA GTG GCT GGC ATC AAC AAG AAG AAT GGA CGA GCG TTT CGC 8310Lys Leu Gly Val Ala Gly Ile Asn Lys Lys Asn Gly Arg Ala Phe Arg970 975 980TTG GCC ATT TCC AAC CTC AAC AAG CTG GAA TCA CTG TCT GTG AGT TCA 8358Leu Ala Ile Ser Asn Leu Asn Lys Leu Glu Ser Leu Ser Val Ser Ser985 990 9951000GCA GGG ATG CCG GGC TTG TGT GGT TGC TTG GAT GAT ATA TCC TCG CCT 8406Ala Gly Met Pro Gly Leu Cys Gly Cys Leu Asp Asp Ile Ser Ser Pro100510101015CCG GAA AAC CTA CAG AGC CTC AAG CTG TAC GGC AGT TTG AAA ACG TTG 8454Pro Glu Asn Leu Gln Ser Leu Lys Leu Tyr Gly Ser Leu Lys Thr Leu102010251030CCG GAA TGG ATC AAG GAG CTC CAG CAT CTC GTG AAG TTA AAA CTA GTG 8502Pro Glu Trp Ile Lys Glu Leu Gln His Leu Val Lys Leu Lys Leu Val103510401045AGT ACT AGG CTA TTG GAG CAC GAC GTT GCT ATG GAA TTC CTT GGG GAA 8550Ser Thr Arg Leu Leu Glu His Asp Val Ala Met Glu Phe Leu Gly Glu105010551060CTA CCG AAG GTG GAA ATT CTA GTT ATT TCA CCG TTT AAG AGT GAA GAA 8598Leu Pro Lys Val Glu Ile Leu Val Ile Ser Pro Phe Lys Ser Glu Glu1065 107010751080ATT CAT TTC AAG CCT CCG CAG ACT GGG ACT GCT TTT GTA AGC CTC AGG 8646Ile His Phe Lys Pro Pro Gln Thr Gly Thr Ala Phe Val Ser Leu Arg108510901095GTG CTC AAG CTT GCA GGA TTA TGG GGC ATC AAA TCA GTG AAG TTT GAG 8694Val Leu Lys Leu Ala Gly Leu Trp Gly Ile Lys Ser Val Lys Phe Glu110011051110GAA GGA ACA ATG CCC AAA CTT GAG AGG CTG CAG GTC CAA GGG CGA ATA 8742Glu Gly Thr Met Pro Lys Leu Glu Arg Leu Gln Val Gln Gly Arg Ile111511201125GAA AAT GAA ATT GGC TTT TCT GGG TTA GAG TTT CTC CAA AAC ATC AAC 8790Glu Asn Glu Ile Gly Phe Ser Gly Leu Glu Phe Leu Gln Asn Ile Asn113011351140GAA GTC CAG CTC AGT GTT TGG TTT CCC ACG GAT CAT GAT AGG ATA AGA 8838Glu Val Gln Leu Ser Val Trp Phe Pro Thr Asp His Asp Arg Ile Arg1145 115011551160GCC GCG CGC GCC GCG GGC GCT GAT TAT GAG ACT GCC TGG GAG GAA GAG 8886Ala Ala Arg Ala Ala Gly Ala Asp Tyr Glu Thr Ala Trp Glu Glu Glu116511701175GTA CAG GAA GCA AGG CGC AAG GGA GGT GAA CTG AAG AGG AAA ATC CGA 8934Val Gln Glu Ala Arg Arg Lys Gly Gly Glu Leu Lys Arg Lys Ile Arg118011851190GAA CAG CTT GCT CGG AAT CCA AAC CAA CCC ATC ATT ACC TGAGCTCCTT 8983Glu Gln Leu Ala Arg Asn Pro Asn Gln Pro Ile Ile Thr119512001205TGGAGTTACT TTGCCGTGCT CCATACTATC CTACAAGTGA GATCCTCTGC AGTACTGCAT 9043GCTCACTGAC ATGTGGACCC GAGGGGCTGT GGGGCCCACA TGTCAGTGAG CAGTACTGTG 9103CAGTACTGCA GAGGACCTGC ATCCACTATC CTATATTATA ATGGATTGTA CTATCGATCC 9163AACTATTCAG ATTAACTCTA TACTAGTGAA CTTATTTTTT TTTGCCGGGC CGGCAAATAG 9223CTGGTCGATG TATATTAAGA ATAAGAAAGG GAATGTACAA GATAGCGCGG TGCGTCAATG 9283CACCACCATT ACAGACGTAA AAGGAAAGCT AAAATCTCAC AGAATGAGTT GCTACAGAGT 9343GACACATGGG GCTAACAAGA CCTGCAGCTA TCCAAGTCTC CCATTCATCC CCCATGGCAG 9403AACAGAACTG GGGAACCGTT GCCGCGATCC CTTCAAACAC CCTTGCGTTT CGCTCTTTCG 9463AAATCAACCA GGTTACAAGG ATCACCCTTG CATCGAACGT TTTGCGGTCA ACCTTAGCAA 9523CAGATTTCCG GGCTGCAAGC CACCAATCAG CAAAATCAGC CGACGATGAG GAGCACGAAA 9583GGACCAGGCG TGTGCGCACC TGACCTCAAA TCTCCTGGGT GTAAGAGCAG CCCACGAAGA 9643TGTGCTGGCA GGTTTCCCCG TCATTGGAGC AGAAATAGCA CACCGGAGCA AGCTTCCATC 9703TGTGACGTTG TAGATTGTTG GCAGTGAGGC AAGCATTGCG CTCGGCGAGA AACATAAAGA 9763ACTTACATCT CGCCGGGGCA AGAGACTTCC AAATAATGGT ATACATATGT AGTATATAGT 9823ATAGTATAGT ATAGTATAAG GGTATTCATT TTGCAGGTTA GCGGTTATCT GCTGCTGTTC 9883CTCCTGCTGC GGCGTGCTGG AGTAGTGTTG TTGGTGGTGG TGCTGATGAC CTAAAATGCT 9943TGCTTGTTTC TATCAAGTTC TCCAGAATGT AGTATGTACT GCATCTTGTT GATTTTTGTC 10003CATAAACGGA TTGCATTATC TGTATATGAC CCAATCAACA ATAAACGGTG TTGCATTTTG 10063TTCCTAAAAG CTCTTAGAGT CTGACCAGTT ATCTCTGTAC GCATCTTCAT GCTGTTCTTT 10123GGGCACTGGT CATGGTTAAA TCACAGTTCA CCGAAACTTA TTTTCTGTAG ACTTATTCTG 10183AAATACTGAG AAATTGAAAT GTAGTAACTA TTGTCTGTAG ACTGCTTTCT CGTTTTTCTT 10243TTGCGGTCGC CATCTCCAGT CAGTATCTAC AGAAGAAGAG CCAATGCAGC CTATTGTCCT 10303TTTTTTGCCG GGTCGGCCG 10322(2)SEQ ID NO4的資料(i)序列特征(A)長度20個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型其它核酸,合成DNA(ix)序列描述SEQ ID NO4AGGGAAAAAT GGAAATGTGC(2)SEQ ID NO5的資料(i)序列特征(A)長度20個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型其它核酸,合成DNA(ix)序列描述SEQ ID NO5AGTAACCTTC TGCTGCCCAA(2)SEQ ID NO6的資料(i)序列特征(A)長度20個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型其它核酸,合成DNA(ix)序列描述SEQ ID NO6TTACCATCCC AGCAATCAGC(2)SEQ ID NO7的資料(i)序列特征(A)長度20個堿基對(B)類型核酸
(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型其它核酸,合成DNA(ix)序列描述SEQ ID NO7AGACACCCTG CCACACAACA
權(quán)利要求
1.賦予植物抗稻瘟病抗性的蛋白質(zhì),其中所述蛋白質(zhì)包括SEQ IDNO1的氨基酸序列,或其一個或多個氨基酸被取代、刪除和/或添加得到的經(jīng)修飾序列。
2.賦予植物抗稻瘟病抗性的蛋白質(zhì),其中所述蛋白質(zhì)由可與包含SEQID NO2和/或NO3核苷酸序列的DNA雜交的DNA編碼。
3.編碼權(quán)利要求1或2的蛋白質(zhì)的DNA。
4.含有權(quán)利要求3的DNA的載體。
5.攜有權(quán)利要求4的載體的宿主細胞。
6.權(quán)利要求5的宿主細胞,其中所述宿主細胞為植物細胞。
7.制備權(quán)利要求1或2的蛋白質(zhì)的方法,其中所述方法包括培養(yǎng)權(quán)利要求5的宿主細胞。
8.含有權(quán)利要求6的宿主細胞的轉(zhuǎn)化植物。
9.權(quán)利要求8的植物,其中所述植物為禾本科。
10.權(quán)利要求8之任一植物,其中所述植物為禾本科稻屬。
11.權(quán)利要求8、9和10之任一項的植物,其中所述植物表現(xiàn)出抗稻瘟病抗性。
12.與權(quán)利要求1或2的蛋白質(zhì)結(jié)合的抗體。
13.包含至少15個核苷酸的DNA,其中所述DNA與權(quán)利要求3的DNA特異性雜交。
全文摘要
本發(fā)明提供了一種稻瘟病抗性基因(Pi-d),其功能等同基因,以及由上述基因編碼的蛋白質(zhì)。該基因用于制備稻瘟病抗性植物,并賦予植物對廣譜的稻瘟病真菌的抗性,因此,其有利于控制病害并增加作物產(chǎn)量。
文檔編號G01N33/577GK1247229SQ9911100
公開日2000年3月15日 申請日期1999年6月12日 優(yōu)先權(quán)日1998年6月12日
發(fā)明者矢野昌裕, 巖本政雄, 片寄裕一, 佐佐木卓治, 王子軒, 山內(nèi)歌子, 石丸理佐 申請人:農(nóng)林水產(chǎn)省農(nóng)業(yè)生物資源研究所所長代表的日本國